国产伦精品一区二区三区视频网站,韩国一区,丁香婷婷深情五月亚洲

大模型動(dòng)態(tài)簡(jiǎn)報(bào)

發(fā)布時(shí)間：2023-07-21 FZ

一、GPT-4最強(qiáng)競(jìng)品Claude 2發(fā)布

具有更強(qiáng)的代碼能力！更長(zhǎng)的上下文！免費(fèi)！

近日，Anthropic公司發(fā)布了他們最新的模型Claude 2，支持200,000 token，可免費(fèi)使用。

Anthropic公司是由OpenAI前研究副總裁Dario Amodei等人在2021年創(chuàng)建，該公司還得到了谷歌、Salesforce和Zoom等公司的投資，目前估值為 41 億美元。今年5月，Anthropic便是受邀參加白宮會(huì)議的四家人工智能公司之一，其他三家分別為谷歌、微軟和OpenAI。

Claude 2 相對(duì)于ChatGPT的優(yōu)勢(shì)——

1、Claude 2 比 GPT-4 便宜5倍。

2、Claude 2 有更新的數(shù)據(jù)。這些數(shù)據(jù)是網(wǎng)站、第三方授權(quán)的數(shù)據(jù)集以及2023年初用戶自愿提供的數(shù)據(jù)的混合。

3、Claude 2 在 GRE 寫作和 HumanEval 編程基準(zhǔn)測(cè)試上表現(xiàn)優(yōu)于 GPT-4。

4、Claude 2 上下文窗口有100,000個(gè)token，是所有商業(yè)模型中最大的。

5、Claude 2 可以分析大約75,000個(gè)單詞，大約是一本書的長(zhǎng)度；相比之下，ChatGPT 可一次性處理 3,000 個(gè)單詞的文本，而 GPT 4 則可以處理 25,000 個(gè)單詞的文本。

6、Claude 2 可以輕松處理任何與代碼相關(guān)的任務(wù)。

網(wǎng)友實(shí)測(cè)Claude 2 的代碼功能：

網(wǎng)友實(shí)測(cè)Claude 2 的文檔總結(jié)功能：

Claude 2技術(shù)論文：https://arxiv.org/abs/2212.08073

二、開源大模型Llama 2可直接商用

一直以來 Llama 可以說是 AI 社區(qū)內(nèi)最強(qiáng)大的開源大模型。但因?yàn)殚_源協(xié)議問題，一直不可免費(fèi)商用。7月19日，Meta 終于發(fā)布了免費(fèi)可商用版本 Llama 2。

此次 Meta 發(fā)布的 Llama 2 模型系列包含 70 億、130 億和 700 億三種參數(shù)變體。相比于 Llama 1，Llama 2 的訓(xùn)練數(shù)據(jù)多了 40%，上下文長(zhǎng)度也翻倍，并采用了分組查詢注意力機(jī)制。具體來說，Llama 2 預(yù)訓(xùn)練模型是在 2 萬億的tokens 上訓(xùn)練的，精調(diào) Chat 模型是在 100 萬人類標(biāo)記數(shù)據(jù)上訓(xùn)練的。

在幾乎所有基準(zhǔn)上，Llama 2 70B 的結(jié)果均與谷歌 PaLM (540B) 持平或表現(xiàn)更好，不過與 GPT-4 和 PaLM-2-L 的性能仍存在較大差距。

Llama 2技術(shù)論文：

https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

三、華為盤古大模型3.0發(fā)布

7 月 7 日，在開發(fā)者大會(huì) 2023（Cloud）上，華為重磅發(fā)布盤古大模型 3.0，將圍繞行業(yè)重塑、技術(shù)扎根、開放同飛三大創(chuàng)新方向，為行業(yè)客戶、伙伴及開發(fā)者提供更好的服務(wù)。

模型聚焦三層架構(gòu)，賦能千行百業(yè)——

L0 層包括NLP、視覺、多模態(tài)、預(yù)測(cè)、科學(xué)計(jì)算五個(gè)基礎(chǔ)模型，提供滿足行業(yè)場(chǎng)景中的多種技能需求。盤古3.0 提供了100 億、380 億、710 億和1000 億參數(shù)等基礎(chǔ)大模型，以匹配不同場(chǎng)景、時(shí)延、響應(yīng)速度的行業(yè)多樣化需求。

L1 層是多個(gè)行業(yè)大模型，華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型，包括政務(wù)，金融，制造，礦山，氣象等大模型；也可以基于行業(yè)客戶的自有數(shù)據(jù)，在盤古大模型的L0 和L1 層上，為客戶訓(xùn)練自有的專用大模型。

L2 層提供了更多細(xì)化場(chǎng)景的模型，更專注于政務(wù)熱線、網(wǎng)點(diǎn)助手、先導(dǎo)藥物篩選、傳送帶異物檢測(cè)、臺(tái)風(fēng)路徑預(yù)測(cè)等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場(chǎng)景，為客戶提供“開箱即用”的模型服務(wù)。

四、國(guó)內(nèi)大模型能力對(duì)比

7月19日，IDC發(fā)布《AI大模型技術(shù)能力評(píng)估報(bào)告，2023》，IDC對(duì)其中9家技術(shù)服務(wù)提供商進(jìn)行了技術(shù)評(píng)估，分別為阿里巴巴、百度、第四范式、科大訊飛、瀾舟科技、云從科技、智譜AI、中國(guó)電信智科以及中科聞歌。

9家大模型技術(shù)能力綜合評(píng)分：

另外，百度文心大模型、阿里巴巴通義大模型、科大訊飛星火大模型、智譜AI大模型在通用能力上表現(xiàn)滿分。“通用能力”指標(biāo)反映的是大模型的整體技能，包括語(yǔ)音識(shí)別、語(yǔ)音合成等自然語(yǔ)言處理；圖片生成、圖片搜索等計(jì)算機(jī)視覺；機(jī)器學(xué)習(xí)/深度神經(jīng)網(wǎng)絡(luò)等底層技術(shù)能力的差異化優(yōu)勢(shì)；意圖識(shí)別、泛化能力、知識(shí)庫(kù)構(gòu)建能力等。

主流大模型各項(xiàng)指標(biāo)評(píng)分：

早前，沙利文根據(jù)AI大模型在產(chǎn)品技術(shù)能力、戰(zhàn)略愿景能力、生態(tài)開放能力三個(gè)維度的綜合表現(xiàn)對(duì)比相關(guān)廠商的綜合競(jìng)爭(zhēng)力，評(píng)分靠前的依次為商湯（SenseCore 商湯 AI 大裝置 + 商湯日日新 SenseNova大模型體系）、百度（AI 大底座+文心大模型）、阿里（M6-OFA +“通義”大模型）、華為（ModelArts + 盤古大模型）、騰訊（HCC 高性能計(jì)算集群+混元大模型）：

分類: 政企熱點(diǎn) 標(biāo)簽: AI, 大模型

上一篇 : 樂思輿情監(jiān)測(cè)：高校如何做好輿情管理？

下一篇 : 恒大之大