合規(guī)、高質(zhì)、實時——樂思爲(wèi)AI公司、NLP研究團隊與數(shù)據(jù)分析機構(gòu)提供中文新聞?wù)Z料、結(jié)構(gòu)化輿情數(shù)據(jù)及實時數(shù)據(jù)API,加速AI模型研發(fā)
原始爬取數(shù)據(jù)質(zhì)量參差不齊,需要投入大量人力進行清洗、去重、標(biāo)註才能用於訓(xùn)練
模型推理和AIGC系統(tǒng)需要接入實時新聞流,自建方案穩(wěn)定性差且維護成本高
適用場景: 大語言模型預(yù)訓(xùn)練、情感分析模型訓(xùn)練、知識圖譜構(gòu)建
適用場景: AIGC內(nèi)容審覈、實時輿情分析應(yīng)用、信息檢索增強RAG
適用場景: 監(jiān)督學(xué)習(xí)模型微調(diào)、小樣本學(xué)習(xí)、模型評測基準(zhǔn)集
樂思數(shù)據(jù)採用標(biāo)準(zhǔn)化JSON格式,支持自定義字段組合
{
"id": "news_20250310_001",
"title": "央行宣佈下調(diào)存款準(zhǔn)備金率0.5個百分點",
"content": "中國人民銀行決定下調(diào)金融機構(gòu)存款準(zhǔn)備金率0.5個百分點,將釋放流動性約1.5萬億元...",
"source": "新華社",
"publish_time": "2025-03-10T09:30:00+08:00",
"category": "金融",
"sentiment": "neutral",
"entities": ["央行", "存款準(zhǔn)備金率", "中國人民銀行"],
"keywords": ["貨幣政策", "流動性", "宏觀調(diào)控"],
"url": "https://news.xinhuanet.com/..."
}
去重率
中文編碼準(zhǔn)確率
每日QA抽檢覆蓋率
| 參數(shù) | 說明 |
|---|---|
| 基礎(chǔ)URL | https://api.knowlesys.cn/v2 |
| 認(rèn)證方式 | Bearer Token / API Key |
| 數(shù)據(jù)格式 | JSON |
| 響應(yīng)時間 | <200ms |
| 限流策略 | 1000 req/min |
| 可用性SLA | 99.9% |
import requests
API_KEY = "your_api_key"
url = "https://api.knowlesys.cn/v2/news/stream"
params = {
"keywords": "人工智能,大模型",
"sentiment": "negative",
"limit": 100,
"start_date": "2025-03-01"
}
headers = {"Authorization": f"Bearer {API_KEY}"}
resp = requests.get(url, params=params,
headers=headers)
data = resp.json()
for item in data['items']:
print(f"{item['title']}")
print(f"來源: {item['source']}")
print(f"情感: {item['sentiment']}\n")
使用新聞?wù)Z料庫進行大模型預(yù)訓(xùn)練,提升模型的新聞理解與生成能力
利用標(biāo)註數(shù)據(jù)集進行情感分析、實體識別等NLP任務(wù)的模型研究與評測
通過實時新聞API獲取市場輿情數(shù)據(jù),輔助量化投資決策
集成樂思數(shù)據(jù)API豐富自有產(chǎn)品的數(shù)據(jù)源,加強市場競爭力
利用新聞數(shù)據(jù)與標(biāo)註樣本優(yōu)化客戶情緒識別與應(yīng)答準(zhǔn)確率
通過結(jié)構(gòu)化輿情數(shù)據(jù)識別有害內(nèi)容模式,完善內(nèi)容審覈算法