OpenAI 推出 GPT-Rosalind:首款生命科學專用 AI,目標把新藥開發從 15 年壓縮到更短

OpenAI 發布 GPT-Rosalind,史上第一款生命科學專用推理模型,針對基因體學、蛋白質工程與生化分析任務優化,連接 50+ 科學資料庫,目標壓縮新藥開發週期。BixBench 達 0.751 通過率,Dyno Therapeutics 盲測達人類專家第 95 百分位。目前僅開放 Amgen、Moderna 等受信任企業存取。

OpenAI 推出 GPT-Rosalind:首款生命科學專用 AI,目標把新藥開發從 15 年壓縮到更短
Image Credits: The Next Web / OpenAI

2026 年 4 月 16 日,OpenAI 正式發布 GPT-Rosalind,這是該公司史上第一款針對特定科學領域深度優化的推理模型,專門用於生物化學、基因體學與蛋白質工程等生命科學研究任務。它的目標只有一個:縮短一顆新藥從實驗室走到病患手中所需的時間。


GPT-Rosalind 是什麼 為何以 Rosalind Franklin 命名

GPT-Rosalind 是指 OpenAI 針對生命科學工作流程重新訓練的域專用推理模型(Domain-Specific Model),能在單一介面中執行文獻查詢、假設生成、實驗設計與多步驟科學分析。

模型名稱致敬了英國化學家與 X 光晶體學家 Rosalind Franklin。1952 年,她拍攝的 DNA X 光繞射圖像是雙螺旋結構發現的關鍵證據,但她的貢獻在 Watson、Crick 與 Wilkins 獲得 1962 年諾貝爾獎時完全缺席——那年她已離世。這個命名是一個刻意為之的歷史糾正,也是 OpenAI 將 GPT-Rosalind 定位為「科學基礎設施」而非「聊天工具」的象徵宣示。

這款模型與 GPT-5.4 的核心差異,在於它是針對生命科學任務進行了額外的領域微調(Fine-tuning),優先強化生物推理能力而非通用問答能力。Heise Online 指出,OpenAI 特別調整了模型對生物領域的「懷疑傾向」,使其降低幻覺(hallucination)與過度自信的回應,這在高風險的科學驗證情境中尤為關鍵。


為什麼藥物開發需要 AI 介入

開發一顆新藥通常需要 10 至 15 年、投入數十億美元,而大多數候選藥物在進入人體臨床試驗之前就已宣告失敗。

這個時間線的主要消耗不在於「突破」,而在於重複性的分析工作:大量文獻搜尋與整理、基因序列解讀、蛋白質結構預測、實驗試劑設計……這些任務佔據了研究人員大量時間,且高度仰賴資訊的跨平台手動整合。研究人員需要在文獻資料庫、基因組資料庫、計算工具和實驗設備之間不斷切換,每一次轉換都有資訊遺失與錯誤的風險。

GPT-Rosalind 試圖打通這個流程:透過連接 50+ 個科學工具與資料庫的 Life Sciences Codex 插件,讓研究人員在同一個介面中查詢文獻、設計試劑、生成假設並規劃實驗,無需手動在多個系統間搬運資料。


三項關鍵效能數字

OpenAI 公布了三組效能測試結果,提供可追溯的外部驗證。

BixBench:0.751 通過率,目前已發布模型中最高。BixBench 是由 Edison Scientific 開發的生物資訊學基準,評估模型在真實生物資訊分析任務上的表現——包含定序資料處理、統計分析與基因組輸出解讀。0.751 的通過率代表在這類實際工作任務上,模型有超過四分之三的機率能給出可用的結果。

LABBench2:11 項任務中有 6 項超越 GPT-5.4。LABBench2 的涵蓋範圍更廣,包含文獻檢索、序列操作與實驗設計。其中表現提升最顯著的是 CloningQA——這個任務要求模型從頭到尾設計分子選殖(Molecular Cloning)所需的完整試劑方案,需要理解實驗的生物邏輯並生成可執行計畫,而不只是回答選擇題。nowadais 分析指出,在這 11 項任務中 GPT-5.4 仍在另外 5 項領先,顯示 GPT-Rosalind 的優勢集中在特定領域任務,而非全面超越。

Dyno Therapeutics 盲測:預測任務達人類專家第 95 百分位。這是三項數字中最值得關注的。OpenAI 與基因治療公司 Dyno Therapeutics 合作,使用從未公開發表的 RNA 序列進行評估,完全排除訓練資料污染的可能性。在序列預測任務上,模型的前 10 個預測方案排在人類專家歷史分數的第 95 百分位;序列生成任務達第 84 百分位。這意味著在最難用「記憶」解釋結果的評估情境下,模型仍表現出真實的生物推理能力。


誰能使用 為何設計成封閉存取

GPT-Rosalind 目前以「受信任存取計畫」(Trusted Access Program)限制開放,僅向通過審核的美國企業用戶提供,且在研究預覽階段不消耗現有的 API 點數。

The Next Web 報導確認,目前已公開的合作機構包括 Amgen、Moderna、Thermo Fisher Scientific 以及 Allen Institute,另有 Los Alamos 國家實驗室參與蛋白質與催化劑設計的 AI 引導研究。2026 年 4 月 14 日,OpenAI 還宣布與丹麥製藥巨頭 Novo Nordisk 建立策略合作,涵蓋從藥物開發到商業運營的 AI 應用。

封閉存取的設計並非行銷策略,而是對雙用途風險(Dual-use Risk)的直接回應。生命科學 AI 模型若開放取用,理論上同樣可被用於設計危險病原體。OpenAI 要求申請機構必須證明其工作方向是改善人類健康結果,並具備相應的安全治理架構,才能獲得存取資格。

這個封閉存取的邏輯,與 OpenAI 同期推出的 GPT-5.4-Cyber 資安模型如出一轍——越是能力強大的專業領域模型,越需要在可信任的生態系統中部署,而不是直接公開發布。


對這波 AI 進入專業領域浪潮的意義

GPT-Rosalind 的發布,是 AI 公司策略轉向的一個明確訊號:從通用模型競賽,轉向高壁壘的垂直領域深耕。

2026 年以來,我們已經看到這個趨勢在多個方向同時展開:OpenAI 的 GPT-5.4-Cyber 針對資安、GPT-Rosalind 針對生命科學;Anthropic 的 Mythos 則在資安領域展現了驚人的零日漏洞發現能力——但也因此引發了金融界的強烈恐慌,各國財長與央行行長曾為此召開危機會議

這個模式說明了一件事:AI 的競爭正在從「誰的通用模型更強」,演變為「誰能在最關鍵的垂直領域建立最深的護城河」。對生命科學來說,這意味著 AI 公司需要獨特的訓練資料(濕實驗室數據、未公開基因序列)、可信任的機構合作夥伴,以及能通過嚴格科學驗證的效能。這三者都比語言能力更難複製,也因此成為更持久的競爭優勢。


評估指標 GPT-Rosalind GPT-5.4(通用) 說明
BixBench 通過率 0.751(最高) 未達同水準 生物資訊學任務
LABBench2 超越 GPT-5.4 項目數 6 / 11 文獻、序列、設計
CloningQA(試劑設計) 顯著領先 基準 多步驟實驗規劃
Dyno RNA 序列預測 第 95 百分位 未公開序列盲測
Dyno RNA 序列生成 第 84 百分位 未公開序列盲測
存取方式 受信任封閉計畫 公開 API 雙用途風險管控

想每週掌握最新 AI 工具與趨勢?訂閱 AI 郵報,每週精選重點直送信箱,讓你不錯過任何重要動態。


資料來源

Read more