<span id="jix7t"></span>

    天天快播:工聯院大模型測評:文心一言在工業(yè)領域表現超過GPT3.5
    發(fā)布日期: 2023-06-29 19:47:55 來源: 經濟參考網

    近期,中國工業(yè)互聯網研究院(簡稱“工聯院”)針對人工智能大模型在中文工業(yè)領域的知識問答能力進行系統(tǒng)性評測。結果顯示,百度文心一言表現超過GPT3.5,綜合評價指數在國內排名第一。


    (資料圖片)

    工聯院本次評測選取了工業(yè)領域典型的八大行業(yè)。百度文心一言在電子設備、裝備、鋼鐵、采礦、電力、石化、建材等七大行業(yè)均獲國內第一。

    據悉,評測對象涵蓋GPT4、GPT3.5、文心一言、ChatGLM等國內外具有代表性的頭部大模型。評估結果選取性能前六名的模型進行公布。

    百度文心一言測評表現超過GPT3.5

    本次工業(yè)知識問答測試主要分為客觀題與主觀題兩大類,總計超過1100個問題。主觀題主要考察四大維度:基礎能力、語句能力、概括能力和邏輯能力。

    評測結果顯示,GPT4表現最佳。國內頭部大模型表現亮眼,整體與GPT3.5相當。其中百度文心一言表現超過GPT3.5,在國內大模型中排名第一。

    在客觀題環(huán)節(jié),評測結果顯示,GPT4與文心一言表現好于其他大模型。但評測結果也同時指出,大模型普遍準確率有較大的提升空間。

    主觀題方面,國內大模型的基礎能力、語句能力與GPT4接近,概括能力、邏輯能力與GPT4有一定差距。

    在大模型的自我認知能力和污染問題分析能力上,GPT4相較于其他大模型表現出更好的能力。

    大模型發(fā)展新熱點:豐富特定行業(yè)專業(yè)知識

    雖然國內大模型在本次評測表現較好,甚至在部分行業(yè)趕超GPT3.5,但工聯院評測報告也指出,國內外通用大模型在工業(yè)知識問答領域探索仍處于初級階段,國內大模型與GPT4有差距,比如行業(yè)間的泛化能力有待加強。

    實際上,工聯院評測報告揭示出通用大模型落地垂直行業(yè)的痛點,缺乏特定行業(yè)的專業(yè)知識。

    關于解決難題的方法,工聯院評測報告給出的建議是,進一步豐富相關專業(yè)領域的數據訓練集,進一步進行專業(yè)化的微調。

    當前,國內科技公司紛紛加強與工業(yè)企業(yè)合作,期望通過在實際場景中探索應用大模型,彌補差距,趕超GPT4.0。

    比如百度文心一言與南方電網電力調度控制中心在電力調度場景探索使用調度AI大模型。在汽車行業(yè),長安汽車基于百度文心大模型正在開發(fā)生成式人工智能產品,賦能一款量產車型,實現提升用戶體驗的目標。除了能源、汽車制造,百度智能云還在建筑、采礦、物流、紡織等領域,探索使用大模型提升運營效率和用戶體驗效果。

    據悉,未來,工聯院將持續(xù)開展通用大模型在工業(yè)領域更多維度的性能評測,包括但不限于大模型的魯棒性、安全性以及人類大價值觀等。(肖智)

    關鍵詞:

    推薦內容

    ?
    欧美午夜一区二区福利视频| 成年人性生活免费视频| 亚洲伊人tv综合网色| 精品国产麻豆免费人成网站| 国产亚洲福利一区二区免费看| 自拍偷自拍亚洲精品播放| 国产福利在线观看视频| 99久久国产宗和精品1上映| 女人与禽交视频免费看| 久久99国产精品久久99果冻传媒| 成人国产精品视频| 久久午夜福利电影| 日本特黄特黄刺激大片| 久久综合丝袜日本网| 无码人妻丰满熟妇区毛片| 中文字幕欧美日韩高清| 奇米精品视频一区二区三区| 中文字幕一区二区三区人妻少妇 | 三上悠亚国产精品一区| 天天天天天天干| 一区视频免费观看| 图片区小说校园综合| 92国产精品午夜福利免费| 国产激情久久久久影院| 色综合久久久无码中文字幕波多| 国产一区二区三区不卡观| 男人操女人免费视频| 亚洲综合伊人久久大杳蕉| 欧美fxxx性| 亚洲国产精品自产在线播放| 欧美人与zoxxxx另类| 亚洲av产在线精品亚洲第一站 | 亚洲熟妇无码爱v在线观看| 最近中文字幕在线mv视频7| 亚洲人成无码网站在线观看| 日本永久免费a∨在线视频 | 韩国无遮挡羞羞漫画| 国产三级日产三级日本三级| 男女无遮挡毛片视频播放| 亚洲综合色成在线播放| 最近2019中文免费字幕|