拓尔思施水才:大模型领域百花齐放,拓尔思会更加关注行业落地
中国网 2023-07-11 16:45:00

近日,国内领先的人工智能、大数据和数据安全产品及服务提供商拓尔思信息技术股份有限公司在京发布了拓天大模型,并面向媒体、金融、政务领域,推出了三大行业大模型。据悉,拓天大模型是拓尔思基于在NLP领域30年技术创新成果、10余年高质量数据和知识资产积累,以及在垂直行业10000多家企业级用户应用实践而推出的。

拓天大模型四大创新点

拓天大模型拥有内容生成、多轮对话、语义理解、跨模态交互、知识型搜索、逻辑推理、安全合规、数学计算、编程能力和插件扩展十大基础能力,具有中文特性增强的可控生成技术、融合搜索引擎的生成结果可信核查、融合稠密向量的跨模态能力加强以及支持外界知识及时更新四大创新点。

大模型的技术突破为人类的技术视野掀开了全新AI宇宙的一角,让人类可以畅想万花筒般的未来。拓尔思总裁施水才在之前的成果发布会上,就从AI科技企业角度阐述了独到的大模型世界观。

总裁施水才

施水才表示,大模型的运营基于算力、数据和基础软件三大要素,在现实世界中,行业、企业、专业之间存在众多独立的数据领地,庞大的数据量和贯通数据领地的难度预示着通用大模型的落地难度。大模型的落地应用会更早、更多地体现在行业、企业等垂类大模型,同样垂类大模型的数量也会大大超过通用大模型。

通用大模型在专业领域落地存在巨大的挑战,包括质量、时效、可控、成本等。同时每一个领域都有专业或私域的知识体系,拥有极为庞杂的知识量,仅靠通用大模型无法满足垂直领域的需求。

和通用大模型相比,拓尔思拓天大模型基于多年自主研发成果,在自主可控、中文特性加强、专业知识加强、实时数据接入、内容安全和价值观对齐、客户私有化部署等方面具有领先优势,并与业务场景深度融合,为用户带来生产力变革。

在谈到如何不断迭代“拓天大模型”的质量,以应对市场需求时,施水才表示,拓尔思本身就拥有自研的搜索引擎技术,配合专业领域实时数据,以及自主研发和开源相结合的大模型算法,通过对媒体、金融、政务等垂直领域数据集进行清洗与处理,进行专业预训练增强,实现专业能力的提升。

目前,拓尔思拥有千亿级“全、准、新”的无监督训练数据和微调优化知识数据,可针对优势行业训练出高质量的行业大模型,为媒体行业内容生产与搜索推荐、金融行业的智能风控与投研、政府的政策分析与公文辅助写作等垂直领域提供深度赋能,满足行业用户的专业化智能创新需求。

同时,拓天大模型通过剪枝、量化、稀疏、蒸馏等部署优化方案,可有效降低大模型对算力资源的要求。拓天推出的垂类大模型参数在百亿级,当前市场主流推理卡单卡就可以满足运行要求,实现模型轻量化部署。

对于拓尔思在大模型领域未来发展,施水才认为,语言大模型是大模型的核心,也是多模态大模型的基石。未来,拓尔思将持续建立和强化拓天大模型商业生态,与行业知识专家、平台型企业、行业头部企业等展开领域知识、算力、业务创新等方面的合作,持续迭代拓天大模型在更多的行业落地,让千行百业的用户真正分享到大模型带来的商业价值。

中国网客户端

国家重点新闻网站,9语种权威发布