華為浙大開發Deep Seek安全版百分百防禦「有害問題」

2025年9月19日

中國科技巨頭華為聯合開發了人工智慧模型DeepSeek一款以安全為重點的版本，據稱該模型在阻止政治敏感話題討論方面「成功率近100%」。

手機屏幕上的Deep Seek應用 — DeepSeek新的安全版，著眼於國家和執政黨的「安全」圖片來源： Davide Bonaldo/ Sipa USA/picture alliance

（德國之聲中文網）周四（9月18日），華為技術有限公司與浙江大學聯合發布了中國首個基於昇騰千卡算力平台的DeepSeek-R1-Safe 基礎大模型。

華為在公司微信公眾號上發布消息稱，它使用了1000塊昇騰AI晶片來訓練大語言模型，該模型是根據DeepSeek-R1的開源模型進行調整而來的。

據華為的發布，測試結果表明，DeepSeek-R1-Safe 針對「有毒有害言論、政治敏感內容、違法行為教唆等14個維度的普通有害問題」整體防禦成功率近 100%。

不過，在針對「情境假設、角色扮演、加密編碼等多個越獄模式」時，整體防禦成功率降為40%。據稱其綜合安全防禦能力達 83%，在同樣測試設置下超過阿里雲的 Qwen-235B 和 DeepSeek-R1-671B 等多個同期模型 8% 至 15%。

中國監管機構要求，國內人工智慧模型及其支持的應用程式必須體現中國的「社會主義價值觀」，以遵守嚴格的言論管控。

華為表示，在通用能力基準測試中，DeepSeek-R1-Safe 相比於 DeepSeek-R1 的性能損耗在1%以內，這些結果表明 DeepSeek-R1-Safe 不僅顯著提升了安全防護能力，也保障了模型的可用性。

華為的研發合作夥伴是浙江大學，也是DeepSeek創始人梁文峰的母校。然而，DeepSeek和梁文峰似乎並未參與該項目。DeepSeek尚未立即回應路透社的置評請求。

今年年初，DeepSeek發布的 DeepSeek-R1 和 V3 因其先進程度震驚了矽谷和中國以外的科技投資者，並引發了1月份美國人工智慧股的大跌。

人工智慧模型在中國已被各行各業和社會廣泛接受、改進和使用。不過中國的人工智慧聊天機器人，例如百度的「文心一言」（Ernie Bot），拒絕回答許多有關中國國內政治的問題，並迴避那些被執政黨認為敏感的話題。

牆外文摘：DeepSeek對全球自由構成威脅

安全版Deep Seek是在上海舉行的「華為全聯接大會」上發布的。大會還發布了華為昇騰晶片發展路線圖，包括2026年第一季度推出昇騰950PR晶片，四季度推出昇騰950DT，2027年四季度推出昇騰960晶片，2028年四季度推出昇騰970晶片。

DW中文有Instagram！歡迎搜尋dw.chinese，看更多深入淺出的圖文與影音報導。

華為浙大開發Deep Seek安全版百分百防禦「有害問題」

賴清德「返核」之路：核電是能源安全解方嗎？

中國新五年計畫聚焦未來科技：加速自主研發應對地緣挑戰

事實核查：中國的機器人士兵只是AI生成？

美揭中國核武動態北京秘密動作引發關注

被吐槽「最沒人味春晚」機器人組團亮相求「破圈」

傳砸1億出場費人形機器人再登馬年春晚

印度人工智慧峰會：OpenAI、谷歌總裁出席莫迪、馬克宏將同台亮相

用「機器人腿」爬長城：外骨骼技術進入中國日常生活

中國空天母艦「鸞鳥」：超級武器還是宣傳攻勢？

探月競爭白熱化：NASA的成功令中國「2030登月」目標備受矚目

「阿耳忒彌斯」繞月飛行任務的美圖

睽違半世紀再度奔月阿耳忒彌斯2號成功升空

靠虛假影像賺真金白銀：AI生成的內容如何在戰火中牟利？

德國養老院裡的「小夥伴」

人工智慧先驅李飛飛創辦的World Labs獲得10億美元融資

SpaceX將重心轉為先建造月球城市

畢馬威：全球AI發展競賽美歐中分列一二三

Grok提供色情化女性及兒童照片功能遭到譴責

DW熱門報導

美國封鎖伊朗港口：中國如何解讀以及權衡利弊？

美伊談判無果而終美軍宣佈將封鎖伊朗港口船隻

北約盟友拒絕參與封鎖行動中國呼籲克製冷靜

美以伊在中東苦戰中國新能源產業勝出？

更多DW報導

美國人對中國的看法有所好轉但「競爭對手」定位仍佔主導

法國議會通過歸還掠奪文物法案中國網民：交給南博吧！

中國一季度經濟增長超預期伊朗戰爭衝擊仍待觀察

美國致函兩家中國銀行：援伊交易將面臨二級制裁

匈牙利候任總理馬札爾宣佈暫停國家媒體廣播

川普：我是「全世界對中國最強硬的人」

亞洲 有關 技術 的更多内容

全球有關 技術 的更多内容

相關話題

DW熱門報導

更多DW報導

亞洲有關技術的更多内容

全球有關技術的更多内容