OpenAI

OpenAI 推出 GPT-Rosalind：首款生命科學專用 AI，目標把新藥開發從 15 年壓縮到更短

OpenAI 發布 GPT-Rosalind，史上第一款生命科學專用推理模型，針對基因體學、蛋白質工程與生化分析任務優化，連接 50+ 科學資料庫，目標壓縮新藥開發週期。BixBench 達 0.751 通過率，Dyno Therapeutics 盲測達人類專家第 95 百分位。目前僅開放 Amgen、Moderna 等受信任企業存取。

Image Credits: The Next Web / OpenAI

2026 年 4 月 16 日，OpenAI 正式發布 GPT-Rosalind，這是該公司史上第一款針對特定科學領域深度優化的推理模型，專門用於生物化學、基因體學與蛋白質工程等生命科學研究任務。它的目標只有一個：縮短一顆新藥從實驗室走到病患手中所需的時間。

GPT-Rosalind 是什麼為何以 Rosalind Franklin 命名

GPT-Rosalind 是指 OpenAI 針對生命科學工作流程重新訓練的域專用推理模型（Domain-Specific Model），能在單一介面中執行文獻查詢、假設生成、實驗設計與多步驟科學分析。

模型名稱致敬了英國化學家與 X 光晶體學家 Rosalind Franklin。1952 年，她拍攝的 DNA X 光繞射圖像是雙螺旋結構發現的關鍵證據，但她的貢獻在 Watson、Crick 與 Wilkins 獲得 1962 年諾貝爾獎時完全缺席——那年她已離世。這個命名是一個刻意為之的歷史糾正，也是 OpenAI 將 GPT-Rosalind 定位為「科學基礎設施」而非「聊天工具」的象徵宣示。

這款模型與 GPT-5.4 的核心差異，在於它是針對生命科學任務進行了額外的領域微調（Fine-tuning），優先強化生物推理能力而非通用問答能力。Heise Online 指出，OpenAI 特別調整了模型對生物領域的「懷疑傾向」，使其降低幻覺（hallucination）與過度自信的回應，這在高風險的科學驗證情境中尤為關鍵。

為什麼藥物開發需要 AI 介入

開發一顆新藥通常需要 10 至 15 年、投入數十億美元，而大多數候選藥物在進入人體臨床試驗之前就已宣告失敗。

這個時間線的主要消耗不在於「突破」，而在於重複性的分析工作：大量文獻搜尋與整理、基因序列解讀、蛋白質結構預測、實驗試劑設計……這些任務佔據了研究人員大量時間，且高度仰賴資訊的跨平台手動整合。研究人員需要在文獻資料庫、基因組資料庫、計算工具和實驗設備之間不斷切換，每一次轉換都有資訊遺失與錯誤的風險。

GPT-Rosalind 試圖打通這個流程：透過連接 50+ 個科學工具與資料庫的 Life Sciences Codex 插件，讓研究人員在同一個介面中查詢文獻、設計試劑、生成假設並規劃實驗，無需手動在多個系統間搬運資料。

三項關鍵效能數字

OpenAI 公布了三組效能測試結果，提供可追溯的外部驗證。

BixBench：0.751 通過率，目前已發布模型中最高。BixBench 是由 Edison Scientific 開發的生物資訊學基準，評估模型在真實生物資訊分析任務上的表現——包含定序資料處理、統計分析與基因組輸出解讀。0.751 的通過率代表在這類實際工作任務上，模型有超過四分之三的機率能給出可用的結果。

LABBench2：11 項任務中有 6 項超越 GPT-5.4。LABBench2 的涵蓋範圍更廣，包含文獻檢索、序列操作與實驗設計。其中表現提升最顯著的是 CloningQA——這個任務要求模型從頭到尾設計分子選殖（Molecular Cloning）所需的完整試劑方案，需要理解實驗的生物邏輯並生成可執行計畫，而不只是回答選擇題。nowadais 分析指出，在這 11 項任務中 GPT-5.4 仍在另外 5 項領先，顯示 GPT-Rosalind 的優勢集中在特定領域任務，而非全面超越。

Dyno Therapeutics 盲測：預測任務達人類專家第 95 百分位。這是三項數字中最值得關注的。OpenAI 與基因治療公司 Dyno Therapeutics 合作，使用從未公開發表的 RNA 序列進行評估，完全排除訓練資料污染的可能性。在序列預測任務上，模型的前 10 個預測方案排在人類專家歷史分數的第 95 百分位；序列生成任務達第 84 百分位。這意味著在最難用「記憶」解釋結果的評估情境下，模型仍表現出真實的生物推理能力。

誰能使用為何設計成封閉存取

GPT-Rosalind 目前以「受信任存取計畫」（Trusted Access Program）限制開放，僅向通過審核的美國企業用戶提供，且在研究預覽階段不消耗現有的 API 點數。

The Next Web 報導確認，目前已公開的合作機構包括 Amgen、Moderna、Thermo Fisher Scientific 以及 Allen Institute，另有 Los Alamos 國家實驗室參與蛋白質與催化劑設計的 AI 引導研究。2026 年 4 月 14 日，OpenAI 還宣布與丹麥製藥巨頭 Novo Nordisk 建立策略合作，涵蓋從藥物開發到商業運營的 AI 應用。

封閉存取的設計並非行銷策略，而是對雙用途風險（Dual-use Risk）的直接回應。生命科學 AI 模型若開放取用，理論上同樣可被用於設計危險病原體。OpenAI 要求申請機構必須證明其工作方向是改善人類健康結果，並具備相應的安全治理架構，才能獲得存取資格。

這個封閉存取的邏輯，與 OpenAI 同期推出的 GPT-5.4-Cyber 資安模型如出一轍——越是能力強大的專業領域模型，越需要在可信任的生態系統中部署，而不是直接公開發布。

對這波 AI 進入專業領域浪潮的意義

GPT-Rosalind 的發布，是 AI 公司策略轉向的一個明確訊號：從通用模型競賽，轉向高壁壘的垂直領域深耕。

2026 年以來，我們已經看到這個趨勢在多個方向同時展開：OpenAI 的 GPT-5.4-Cyber 針對資安、GPT-Rosalind 針對生命科學；Anthropic 的 Mythos 則在資安領域展現了驚人的零日漏洞發現能力——但也因此引發了金融界的強烈恐慌，各國財長與央行行長曾為此召開危機會議。

這個模式說明了一件事：AI 的競爭正在從「誰的通用模型更強」，演變為「誰能在最關鍵的垂直領域建立最深的護城河」。對生命科學來說，這意味著 AI 公司需要獨特的訓練資料（濕實驗室數據、未公開基因序列）、可信任的機構合作夥伴，以及能通過嚴格科學驗證的效能。這三者都比語言能力更難複製，也因此成為更持久的競爭優勢。

評估指標	GPT-Rosalind	GPT-5.4（通用）	說明
BixBench 通過率	0.751（最高）	未達同水準	生物資訊學任務
LABBench2 超越 GPT-5.4 項目數	6 / 11	—	文獻、序列、設計
CloningQA（試劑設計）	顯著領先	基準	多步驟實驗規劃
Dyno RNA 序列預測	第 95 百分位	—	未公開序列盲測
Dyno RNA 序列生成	第 84 百分位	—	未公開序列盲測
存取方式	受信任封閉計畫	公開 API	雙用途風險管控

想每週掌握最新 AI 工具與趨勢？訂閱 AI 郵報，每週精選重點直送信箱，讓你不錯過任何重要動態。

OpenAI 推出 GPT-Rosalind：首款生命科學專用 AI，目標把新藥開發從 15 年壓縮到更短

GPT-Rosalind 是什麼為何以 Rosalind Franklin 命名

為什麼藥物開發需要 AI 介入

三項關鍵效能數字

誰能使用為何設計成封閉存取

對這波 AI 進入專業領域浪潮的意義

資料來源

Read more

Gemini Robotics 2 是什麼？Google DeepMind 讓機器人學會全身控制、多步驟推理與團隊協作

AMD Helios 是什麼？對抗 NVIDIA 的 AI 機櫃級系統，為何企業更在意整櫃而非單張 GPU

Meta 為什麼可能限制工程師的 AI Token 預算？從實驗自由走向成本管理

Runway Dev 是什麼？AI 影片競爭從單一模型走向多模型平台

GPT-Rosalind 是什麼 為何以 Rosalind Franklin 命名

為什麼藥物開發需要 AI 介入

三項關鍵效能數字

誰能使用 為何設計成封閉存取

對這波 AI 進入專業領域浪潮的意義

資料來源

Read more

Gemini Robotics 2 是什麼？Google DeepMind 讓機器人學會全身控制、多步驟推理與團隊協作

AMD Helios 是什麼？對抗 NVIDIA 的 AI 機櫃級系統，為何企業更在意整櫃而非單張 GPU

Meta 為什麼可能限制工程師的 AI Token 預算？從實驗自由走向成本管理

Runway Dev 是什麼？AI 影片競爭從單一模型走向多模型平台

GPT-Rosalind 是什麼為何以 Rosalind Franklin 命名

誰能使用為何設計成封閉存取