近日,2023全球数商大会举行,吸引了千余家国际国内数商企业、万余名专业观众线下参与。本届数商大会以“数联全球、商通未来”为主题,聚焦数字经济时代下,数据要素推动实体经济发展,打造全球数据要素市场的风向标。

作为数据要素领域国际盛会
本届大会

Part.01
充分发挥高质量数据资源优势
打造“中华知识大模型”

另外,知网与华为合作成立了华知大模型及人工智能联合创新实验室,打造了可融入行业生产系统的可信增强“中华知识大模型”,面向垂直领域,开发各类行业大模型和场景大模型,构建“1+N+X”三层架构体系。与此同时,知网提出打造生成式知识服务,将学术研究助手、AIGC检测、AI智能写作等服务产品推广落地。
“
“下一步,我们将充分利用数据要素和人工智能大模型技术双轮驱动优势,依托丰富的数据要素产品化和市场化经验,发挥先行先试的示范作用,更好推动数据要素赋能千行百业,促进数字化转型和智能化升级。”知网工作人员告诉上海科技。
”
据悉,同方知网 1995 年始创于清华大学,坚持数据要素和人工智能大模型技术双轮驱动,致力于全球知识资源的大规模、增值性整合利用,与全球2万多家教育、科研和出版机构合作建成“世界知识大数据”,提供数据产品及增值服务,是业界领先的知识服务商和国家文化出口重点企业。
Part.02
提升多元语料数据供给
推动人工智能产业发展
数据的数量是大数据研发的根本。丰富的、 巨量的语料能为大数据和人工智能研发提供必要的数据基础。“根据国内大语言模型研发的需求,传思目前在生产和处理包括问答类数据、 多轮对话类数据等大语言模型训练数据。”

在通用领域基础上, 对语料进行专业领域划分,是训练垂直领域机翻引擎和大语言模型的必由路径。然而,目前的公开数据不但质量良莠不齐、价值观可能不正确,而且存在专业知识库难以构建等难题,“训练后效果会有隐患”。
“
目前互联网上的公开数据集存在着噪声、偏差等问题,会对模型的正确性和质量产生一定的影响。“所以,传思目前在整理和加工源于出版物的知识类各垂直领域数据。”董锐说。
”
企业及专家观点不代表官方立场
↓分享
↓点赞
↓在看