
具有更強(qiáng)的代碼能力!更長(zhǎng)的上下文!免費(fèi)!
近日,Anthropic公司發(fā)布了他們最新的模型Claude 2,支持200,000 token,可免費(fèi)使用。
Anthropic公司是由OpenAI前研究副總裁Dario Amodei等人在2021年創(chuàng)建,該公司還得到了谷歌、Salesforce和Zoom等公司的投資,目前估值為 41 億美元。今年5月,Anthropic便是受邀參加白宮會(huì)議的四家人工智能公司之一,其他三家分別為谷歌、微軟和OpenAI。
Claude 2 相對(duì)于ChatGPT的優(yōu)勢(shì)——
1、Claude 2 比 GPT-4 便宜5倍。
2、Claude 2 有更新的數(shù)據(jù)。這些數(shù)據(jù)是網(wǎng)站、第三方授權(quán)的數(shù)據(jù)集以及2023年初用戶自愿提供的數(shù)據(jù)的混合。
3、Claude 2 在 GRE 寫作和 HumanEval 編程基準(zhǔn)測(cè)試上表現(xiàn)優(yōu)于 GPT-4。
4、Claude 2 上下文窗口有100,000個(gè)token,是所有商業(yè)模型中最大的。
5、Claude 2 可以分析大約75,000個(gè)單詞,大約是一本書的長(zhǎng)度;相比之下,ChatGPT 可一次性處理 3,000 個(gè)單詞的文本,而 GPT 4 則可以處理 25,000 個(gè)單詞的文本。
6、Claude 2 可以輕松處理任何與代碼相關(guān)的任務(wù)。
網(wǎng)友實(shí)測(cè)Claude 2 的代碼功能:

網(wǎng)友實(shí)測(cè)Claude 2 的文檔總結(jié)功能:

Claude 2技術(shù)論文:https://arxiv.org/abs/2212.08073
一直以來 Llama 可以說是 AI 社區(qū)內(nèi)最強(qiáng)大的開源大模型。但因?yàn)殚_源協(xié)議問題,一直不可免費(fèi)商用。7月19日,Meta 終于發(fā)布了免費(fèi)可商用版本 Llama 2。
此次 Meta 發(fā)布的 Llama 2 模型系列包含 70 億、130 億和 700 億三種參數(shù)變體。相比于 Llama 1,Llama 2 的訓(xùn)練數(shù)據(jù)多了 40%,上下文長(zhǎng)度也翻倍,并采用了分組查詢注意力機(jī)制。具體來說,Llama 2 預(yù)訓(xùn)練模型是在 2 萬億的tokens 上訓(xùn)練的,精調(diào) Chat 模型是在 100 萬人類標(biāo)記數(shù)據(jù)上訓(xùn)練的。

在幾乎所有基準(zhǔn)上,Llama 2 70B 的結(jié)果均與谷歌 PaLM (540B) 持平或表現(xiàn)更好,不過與 GPT-4 和 PaLM-2-L 的性能仍存在較大差距。

Llama 2技術(shù)論文:
https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/
7 月 7 日,在開發(fā)者大會(huì) 2023(Cloud)上,華為重磅發(fā)布盤古大模型 3.0,將圍繞行業(yè)重塑、技術(shù)扎根、開放同飛三大創(chuàng)新方向,為行業(yè)客戶、伙伴及開發(fā)者提供更好的服務(wù)。

模型聚焦三層架構(gòu),賦能千行百業(yè)——
L0 層包括NLP、視覺、多模態(tài)、預(yù)測(cè)、科學(xué)計(jì)算五個(gè)基礎(chǔ)模型,提供滿足行業(yè)場(chǎng)景中的多種技能需求。盤古3.0 提供了100 億、380 億、710 億和1000 億參數(shù)等基礎(chǔ)大模型,以匹配不同場(chǎng)景、時(shí)延、響應(yīng)速度的行業(yè)多樣化需求。
L1 層是多個(gè)行業(yè)大模型,華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型,包括政務(wù),金融,制造,礦山,氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型的L0 和L1 層上,為客戶訓(xùn)練自有的專用大模型。
L2 層提供了更多細(xì)化場(chǎng)景的模型,更專注于政務(wù)熱線、網(wǎng)點(diǎn)助手、先導(dǎo)藥物篩選、傳送帶異物檢測(cè)、臺(tái)風(fēng)路徑預(yù)測(cè)等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場(chǎng)景,為客戶提供“開箱即用”的模型服務(wù)。
7月19日,IDC發(fā)布《AI大模型技術(shù)能力評(píng)估報(bào)告,2023》,IDC對(duì)其中9家技術(shù)服務(wù)提供商進(jìn)行了技術(shù)評(píng)估,分別為阿里巴巴、百度、第四范式、科大訊飛、瀾舟科技、云從科技、智譜AI、中國(guó)電信智科以及中科聞歌。
9家大模型技術(shù)能力綜合評(píng)分:

另外,百度文心大模型、阿里巴巴通義大模型、科大訊飛星火大模型、智譜AI大模型在通用能力上表現(xiàn)滿分。“通用能力”指標(biāo)反映的是大模型的整體技能,包括語(yǔ)音識(shí)別、語(yǔ)音合成等自然語(yǔ)言處理;圖片生成、圖片搜索等計(jì)算機(jī)視覺;機(jī)器學(xué)習(xí)/深度神經(jīng)網(wǎng)絡(luò)等底層技術(shù)能力的差異化優(yōu)勢(shì);意圖識(shí)別、泛化能力、知識(shí)庫(kù)構(gòu)建能力等。
主流大模型各項(xiàng)指標(biāo)評(píng)分:

早前,沙利文根據(jù)AI大模型在產(chǎn)品技術(shù)能力、戰(zhàn)略愿景能力、生態(tài)開放能力三個(gè)維度的綜合表現(xiàn)對(duì)比相關(guān)廠商的綜合競(jìng)爭(zhēng)力,評(píng)分靠前的依次為商湯(SenseCore 商湯 AI 大裝置 + 商湯日日新 SenseNova大模型體系)、百度(AI 大底座+文心大模型)、阿里(M6-OFA +“通義”大模型)、華為(ModelArts + 盤古大模型)、騰訊(HCC 高性能計(jì)算集群+混元大模型):
