華為浙大開發Deep Seek安全版 百分百防禦「有害問題」
2025年9月19日
(德國之聲中文網)周四(9月18日),華為技術有限公司與浙江大學聯合發布了中國首個基於昇騰千卡算力平台的DeepSeek-R1-Safe 基礎大模型。
華為在公司微信公眾號上發布消息稱,它使用了1000塊昇騰AI晶片來訓練大語言模型,該模型是根據DeepSeek-R1的開源模型進行調整而來的。
據華為的發布,測試結果表明,DeepSeek-R1-Safe 針對「有毒有害言論、政治敏感內容、違法行為教唆等14個維度的普通有害問題」整體防禦成功率近 100%。
不過,在針對「情境假設、角色扮演、加密編碼等多個越獄模式」時,整體防禦成功率降為40%。據稱其綜合安全防禦能力達 83%,在同樣測試設置下超過阿里雲的 Qwen-235B 和 DeepSeek-R1-671B 等多個同期模型 8% 至 15%。
中國監管機構要求,國內人工智慧模型及其支持的應用程式必須體現中國的「社會主義價值觀」,以遵守嚴格的言論管控。
華為表示,在通用能力基準測試中,DeepSeek-R1-Safe 相比於 DeepSeek-R1 的性能損耗在1%以內,這些結果表明 DeepSeek-R1-Safe 不僅顯著提升了安全防護能力,也保障了模型的可用性。
華為的研發合作夥伴是浙江大學,也是DeepSeek創始人梁文峰的母校。然而,DeepSeek和梁文峰似乎並未參與該項目。DeepSeek尚未立即回應路透社的置評請求。
今年年初,DeepSeek發布的 DeepSeek-R1 和 V3 因其先進程度震驚了矽谷和中國以外的科技投資者,並引發了1月份美國人工智慧股的大跌。
人工智慧模型在中國已被各行各業和社會廣泛接受、改進和使用。不過中國的人工智慧聊天機器人,例如百度的「文心一言」 (Ernie Bot),拒絕回答許多有關中國國內政治的問題,並迴避那些被執政黨認為敏感的話題。
安全版Deep Seek是在上海舉行的「華為全聯接大會」上發布的。大會還發布了華為昇騰晶片發展路線圖,包括2026年第一季度推出昇騰950PR晶片,四季度推出昇騰950DT,2027年四季度推出昇騰960晶片,2028年四季度推出昇騰970晶片。
DW中文有Instagram!歡迎搜尋dw.chinese,看更多深入淺出的圖文與影音報導。
© 2025年德國之聲版權聲明:本文所有內容受到著作權法保護,如無德國之聲特別授權,不得擅自使用。任何不當行為都將導致追償,並受到刑事追究。