合規(guī)、高質(zhì)、實(shí)時(shí)——樂思為AI公司、NLP研究團(tuán)隊(duì)與數(shù)據(jù)分析機(jī)構(gòu)提供中文新聞?wù)Z料、結(jié)構(gòu)化輿情數(shù)據(jù)及實(shí)時(shí)數(shù)據(jù)API,加速AI模型研發(fā)
原始爬取數(shù)據(jù)質(zhì)量參差不齊,需要投入大量人力進(jìn)行清洗、去重、標(biāo)注才能用于訓(xùn)練
模型推理和AIGC系統(tǒng)需要接入實(shí)時(shí)新聞流,自建方案穩(wěn)定性差且維護(hù)成本高
適用場(chǎng)景: 大語(yǔ)言模型預(yù)訓(xùn)練、情感分析模型訓(xùn)練、知識(shí)圖譜構(gòu)建
適用場(chǎng)景: AIGC內(nèi)容審核、實(shí)時(shí)輿情分析應(yīng)用、信息檢索增強(qiáng)RAG
適用場(chǎng)景: 監(jiān)督學(xué)習(xí)模型微調(diào)、小樣本學(xué)習(xí)、模型評(píng)測(cè)基準(zhǔn)集
樂思數(shù)據(jù)采用標(biāo)準(zhǔn)化JSON格式,支持自定義字段組合
{
"id": "news_20250310_001",
"title": "央行宣布下調(diào)存款準(zhǔn)備金率0.5個(gè)百分點(diǎn)",
"content": "中國(guó)人民銀行決定下調(diào)金融機(jī)構(gòu)存款準(zhǔn)備金率0.5個(gè)百分點(diǎn),將釋放流動(dòng)性約1.5萬億元...",
"source": "新華社",
"publish_time": "2025-03-10T09:30:00+08:00",
"category": "金融",
"sentiment": "neutral",
"entities": ["央行", "存款準(zhǔn)備金率", "中國(guó)人民銀行"],
"keywords": ["貨幣政策", "流動(dòng)性", "宏觀調(diào)控"],
"url": "https://news.xinhuanet.com/..."
}
去重率
中文編碼準(zhǔn)確率
每日QA抽檢覆蓋率
| 參數(shù) | 說明 |
|---|---|
| 基礎(chǔ)URL | https://api.knowlesys.cn/v2 |
| 認(rèn)證方式 | Bearer Token / API Key |
| 數(shù)據(jù)格式 | JSON |
| 響應(yīng)時(shí)間 | <200ms |
| 限流策略 | 1000 req/min |
| 可用性SLA | 99.9% |
import requests
API_KEY = "your_api_key"
url = "https://api.knowlesys.cn/v2/news/stream"
params = {
"keywords": "人工智能,大模型",
"sentiment": "negative",
"limit": 100,
"start_date": "2025-03-01"
}
headers = {"Authorization": f"Bearer {API_KEY}"}
resp = requests.get(url, params=params,
headers=headers)
data = resp.json()
for item in data['items']:
print(f"{item['title']}")
print(f"來源: {item['source']}")
print(f"情感: {item['sentiment']}\n")
使用新聞?wù)Z料庫(kù)進(jìn)行大模型預(yù)訓(xùn)練,提升模型的新聞理解與生成能力
利用標(biāo)注數(shù)據(jù)集進(jìn)行情感分析、實(shí)體識(shí)別等NLP任務(wù)的模型研究與評(píng)測(cè)
通過實(shí)時(shí)新聞API獲取市場(chǎng)輿情數(shù)據(jù),輔助量化投資決策
集成樂思數(shù)據(jù)API豐富自有產(chǎn)品的數(shù)據(jù)源,加強(qiáng)市場(chǎng)競(jìng)爭(zhēng)力
利用新聞數(shù)據(jù)與標(biāo)注樣本優(yōu)化客戶情緒識(shí)別與應(yīng)答準(zhǔn)確率
通過結(jié)構(gòu)化輿情數(shù)據(jù)識(shí)別有害內(nèi)容模式,完善內(nèi)容審核算法