劉聰現場用星火認知大模型生成了一段歡迎詞,展示了大模型的文本生成能力。
為了測試不同文本類型的生成能力,劉聰還讓星火認知大模型生成了郵件、故事、中英品宣文案等文字內容。
認知大模型,生成了一段孫悟空和奧特曼的故事,還使用語音朗讀了這段現場生成的小故事。
所有內容都是大模型隨機生成的,即使是同樣的關鍵詞和描述,每次生成的內容也是不同的。星火認知大模型在中文文本生成方面的能力已經超越了ChatGPT,英文方面達到了4.29分,而ChatGPT是4.48分。
2.語言理解能力
科大訊飛通過兩個例子,演示了大模型在語法檢查和語義理解上的成果。
在輸入一段存在單詞拼寫錯誤、單復數錯誤、時態錯誤等問題的英文段落后,星火認知大模型迅速生成了一段糾正所有錯誤的文字。
展示語義理解能力時,劉慶峰以“俗話說男子漢大丈夫寧死不屈,但俗話又說男子漢大丈夫能屈能伸”為例,測試了大模型是否能準確理解這兩句話背后的含義。
此外,對同一句話在不同語境中的不同理解,大模型也給出了準確的回答。
3.知識問答
大模型的知識問答能力包括生活常識類、科學知識、工作技巧、醫學知識等。比如,在醫療領域,大模型將不僅成為醫生的助手,還會成為每個人的健康助手。
后續更多科普知識也會被融入到大模型中。在中國科學院支持下,大模型將持續不斷學習更多科學資料,不斷提升科學問答能力。
4.邏輯推理
為了測試星火大模型是否真的可以理解人類提問,劉慶峰通過常識理解和故事編輯兩種方式進行了演示。
現場問大模型“孔子在2008年奧運會上發表了什么講話?”大模型基于歷史和常識判斷出孔子不可能出現在奧運會現場。讓大模型以此為主題生成一個故事時,它則從創作維度根據給出的提示編輯生成了一個小故事。
5.數學能力
數學能力一定意義上代表了認知大模型通用能力的認知水平,星火認知大模型在數學能力方面遙遙領先。
從基礎計算到三角形求度數再到應用題,星火認知大模型都在現場演示中給出了準確答案。
6.代碼能力
發布會現場星火認知大模型進行了一小段“找出1到100之間的質數并輸出結果”代碼生成的演示。
代碼生成能力主要針對工業互聯網和企業內部使用,星火認知大模型仍在不斷訓練中,未來兩到三個月代碼運行能力將有很大提升。
7.多模態輸入和表達能力
這一功能不僅可以應用在簡單的圖文翻譯中,也可以成為旅行助手,在提供翻譯功能的同時,介紹不同名勝古跡背后的含義和歷史故事。
更值得一提的是,星火認知大模型還可以根據文字直接生成視頻內容,無論是聲音、虛擬人形象、唇型、手勢還是視頻背景都由大模型實時生成。
后續,星火認知大模型完善的方向如下:進一步提升大模型的開放式問答和多輪對話能力;實現代碼生成能力升級,并將多模態交互能力開放給客戶;全面實現通用模型對標ChatGPT等。
二、四個領域,取得落地成果
在教育領域,一直以來,作文提升都是教學中的一大難點,以批改為例,找出病句、好句、給出評語,一篇文章最少需要老師用30分鐘才能完成。
而星火大模型的語言能力和學習機結合,可以對作文快速進行深度理解,自動生成評語和范文。
在辦公領域,大模型升級產品,幫助智慧辦公邁入了全新階段,可以滿足語音轉寫、會議記錄等多語種翻譯等多種辦公需求,助力職場人提升工作效率。
在汽車領域和數字人領域,大模型和產品及業務進行全面結合,比如虛擬人智能交互機現已有1000多個虛擬形象資產、300多個專業聲音、30多萬用戶自定義音庫,可以提供更加自動化、個性化的數字員工服務,實現24小時不打烊營業。
三、中外大模型能力差距爭議
追趕OpenAI首先需要一套科學系統的評測體系。
劉慶峰認為,認知大模型剛剛起步,還在快速成長和迭代過程中。
讓這次智慧涌現的認知智能解決社會剛需,需要一套腳踏實地的科學系統的評測體系。
在認知大模型還在快速迭代中,如果只是找單點例子來證明某個系統的強弱,是沒有意義的。
*文章為作者獨立觀點,不代表筆記俠立場。
左戰略、右組織,掃碼成為筆記俠的朋友
領取10萬字+的戰略、組織干貨合集,迭代你的賺錢思路
分享、點贊、在看,3連3連
責任編輯: