跳轉到主要內容
公告

開源遺產與 AI 的許可挑戰

作者: 2025 年 5 月 22 日暫無評論

開源許可徹底改變了軟體開發,建立了一個建立在共享創新和協作基礎上的繁榮生態系統。MIT 和 Apache-2.0 等許可證為開發者提供了一種標準、法律上健全的方式來共享程式碼,減少了摩擦並加速了採用。

今天,我們正站在開放人工智慧模型類似的轉折點。這些模型日益成為研究和行業的基礎,卻缺乏同等的許可標準。現有的開源軟體許可證並非為人工智慧模型設計,而大多數特定於模型的許可證要麼過於複雜,要麼限制過多,要麼法律上模糊不清。

為了充分釋放開放人工智慧的潛力,我們需要一個專門為機器學習的現實而設計的許可證。這就是 OpenMDW 的用武之地。

為什麼人工智慧模型需要新的許可證

人工智慧模型與傳統軟體根本不同。它們是:

  • 多型別元件的複合體:包括程式碼、架構、訓練資料、權重、文件和評估協議。
  • 受制於重疊的知識產權制度:例如版權、資料庫權利和商業秘密,這些因司法管轄區而異。
  • 分發時沒有一致的“開放”定義:導致許可環境碎片化。

這種複雜性導致了大量定製的、不相容的許可證,這些許可證通常:

  • 限制再分發、重用或修改。
  • 未能解決模型獨有的法律細微差別。
  • 給開發者和使用者都帶來了不確定性。

結果是什麼?開放生態系統中的摩擦、法律模糊性以及協作和創新的巨大障礙。

OpenMDW 的起源

OpenMDW,即開放模型、資料和權重許可證(Open Model, Data and Weights License)的縮寫,源於實施 模型開放性框架 (MOF)的努力。MOF 是一個三層分類系統,它定義了模型真正“開放”的含義——不僅僅是有限制或使用限制的可用,而是在其程式碼、架構、引數、訓練資料和文件方面都開放許可。

為了使 MOF 實用化,模型開發者需要一個簡單、標準的許可證,他們可以將其放入任何儲存庫中,就像 Apache-2.0 或 MIT 用於軟體一樣。它應該專門為多種型別的內容(包括模型,而不僅僅是程式碼)而設計。

OpenMDW 的與眾不同之處

OpenMDW 是第一個從頭開始為機器學習模型設計的真正寬鬆的許可證。以下是它與眾不同之處:

涵蓋整個模型堆疊

它旨在應用於模型釋出的所有元件:

  • 模型架構
  • 引數和檢查點
  • 訓練和推理程式碼
  • 預處理和評估資料
  • 文件(例如模型卡、資料卡)

重要的是,OpenMDW 不要求 包含所有元件。它僅適用於所分發的內容,同時與可能管轄儲存庫某些部分的其他許多許可證相容。

(OpenMDW 使用者當然必須繼續遵守適用於其儲存庫中任何其他現有材料的任何其他第三方許可證,例如透過提供許可證文字和通知、適用時的原始碼等。)

全面且有法律依據

OpenMDW 授予廣泛的許可權,包括在 版權、專利、資料庫和商業秘密法 下,涵蓋了與人工智慧製品相關的廣泛法律權利。

它還包括:

  • 專利訴訟終止條款 以阻止模型材料使用者提出專利主張
  • 歸屬要求 以保持出處和信任

與政策和開源原則相容

  • 旨在與歐盟人工智慧法案中提及的“自由和開源許可證”完全一致
  • 支援開源倡議 (OSI) 的 10 項原則,包括自由再分發、原始碼可用性、衍生作品以及不歧視個人或團體

設計簡單

  • 一個許可證,一個檔案,一個位置:儲存庫根目錄下的 LICENSE 檔案
  • 沒有複雜的許可矩陣:下游使用者不會感到困惑
  • 易於整合到任何儲存庫中:就像 MIT 或 Apache-2.0 一樣。

理解 OpenMDW 許可證

定義和範圍

OpenMDW 下的 模型材料 包括:

  • 模型架構和訓練引數;以及
  • 根據 OpenMDW 提供的所有其他相關材料,可以包括:
    • 預處理、訓練和推理程式碼
    • 資料集和評估指令碼
    • 文件、元資料和工具

這個全面的範圍直接對映到 模型開放性框架 (MOF),確保如果模型的所有關鍵元素都包含在分發中,它們都將受到涵蓋。

模型材料 並非旨在強制要求 必須包含在分發中。它只規定分發中包含的內容受許可證涵蓋,並排除分發中受其他許可證涵蓋的任何內容。

權利授予

OpenMDW 授予廣泛的權利,允許“不受限制地處理模型材料”,例如:

  • 使用、修改和分發 模型材料
  •  版權、專利、資料庫和商業秘密法 下操作

這些權利是 免費授予的,沒有使用範圍限制,消除了開發者和企業之間的模糊性。

歸屬,而非 Copyleft

OpenMDW 僅施加 最低限度的義務:

  • 保留許可證文字
  • 保留原始版權和歸屬宣告

沒有 copyleft 或 share-alike 條件,這意味著衍生模型和整合可以保持完全寬鬆。這允許 最大程度的重用和互操作性。

專利保護

為了防止濫用公共資源,OpenMDW 包含 專利訴訟終止條款: 如果被許可方就模型材料發起進攻性專利訴訟,其許可證將被撤銷。

這與開源軟體中的最佳實踐相呼應,並有助於維護協作生態系統。

輸出不受限制

一項重大創新: 使用 OpenMDW 下的模型生成的輸出完全不受模型材料提供者施加的許可限制。

這消除了關於生成的文字、影像、程式碼或預測是否受到模型提供者限制的困惑——這是現有許可證中常見的不確定點。

如何採用 OpenMDW

採用 OpenMDW 簡單明瞭:

  1. 將 OpenMDW-1.0 許可證檔案新增到您的儲存庫中: LICENSE
  2. 在 README 中 清楚地表明 您的釋出在 OpenMDW-1.0 下
  3. 確保模型包的所有元件都已涵蓋並披露,包括突出顯示任何受其他許可證約束的元件

為什麼現在很重要

人工智慧社群正在達到一個轉折點。開放模型——從 AI2 的 Molmo 到 Mistral,以及像 DeepSeek 的 R1 這樣的開放推理模型和多模態代理——正在重塑開放的可能性。但它們的許可狀態仍然難以描述,因為軟體許可證可能無法清晰地對映到人工智慧模型上。

一些使用限制性許可證的開放權重模型已逐漸變得更加寬鬆;但由於缺乏可用的強大法律框架用於許可,模型生產者被迫在設計自己的許可證時傾向於謹慎。

在他最近的帖子中, AI2 的 Nathan Lambert 正確地指出:“開源人工智慧長期以來的待辦事項之一是更好的許可證”,OpenMDW 有助於滿足這一需求。

正如 Apache-2.0 和 MIT 成為開源軟體的基礎許可證一樣, OpenMDW 有望成為 開放模型 的標準。其清晰性、範圍和寬鬆性降低了開發者的障礙,併為希望在開放基礎上負責任地構建的公司和研究人員創造了確定性。

這不僅僅是關於法律清晰度,更是關於實現一個 創新豐富和開源的人工智慧生態系統。

訪問 openmdw.ai 獲取更多詳細資訊,包括常見問題解答。