近日,新華社研究院中國企業(yè)發(fā)展研究中心對(duì)主流大模型產(chǎn)品進(jìn)行了體驗(yàn)評(píng)測(cè),發(fā)布了《人工智能大模型體驗(yàn)報(bào)告》。《報(bào)告》顯示,百度文心一言總得分位居國內(nèi)第一,并在基礎(chǔ)能力、智商、情商、工作提效等維度均獲國內(nèi)第一。在智商測(cè)試部分,百度文心一言意外超過ChatGPT3.5,表現(xiàn)突出,位居排名第二,僅次于GPT4。
在綜合指數(shù)評(píng)價(jià)方面,本次評(píng)測(cè)選取4大維度(基礎(chǔ)能力、智商測(cè)試、情商測(cè)試、工作提效能力)、36個(gè)子能力,共300個(gè)問題,對(duì)目前主流大模型產(chǎn)品進(jìn)行測(cè)試。
同時(shí),研究院還邀請(qǐng)相關(guān)專家組成評(píng)測(cè)團(tuán)隊(duì)深入分析各個(gè)產(chǎn)品的語義理解、知識(shí)儲(chǔ)備、邏輯能力等,最終得出各廠商的大模型綜合指數(shù)評(píng)價(jià)。
綜合評(píng)測(cè)結(jié)果顯示:ChatGPT系列模型各項(xiàng)指標(biāo)表現(xiàn)優(yōu)異,Chat-GPT4.0版本各項(xiàng)能力在3.5版本的基礎(chǔ)上均有一定程度提升。
由百度開發(fā)的人工智能大模型文心一言是目前國內(nèi)自主研發(fā)的大模型中具有優(yōu)勢(shì)的產(chǎn)品。其余大模型產(chǎn)品也在基礎(chǔ)能力方面表現(xiàn)優(yōu)良,但面對(duì)較復(fù)雜的工作內(nèi)容或情商環(huán)境仍有不同程度的進(jìn)步空間。

免責(zé)聲明: 本文內(nèi)容來源于快科技 ,不代表本平臺(tái)的觀點(diǎn)和立場(chǎng)。
版權(quán)聲明:本文內(nèi)容由注冊(cè)用戶自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,武岡人網(wǎng)僅提供信息存儲(chǔ)服務(wù),不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。如果您發(fā)現(xiàn)本站中有涉嫌抄襲的內(nèi)容,請(qǐng)通過郵箱(admin@4305.cn)進(jìn)行舉報(bào),一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。