辽宁suncitygroup太阳集团官方网站金属科技有限公司

了解更多
scroll down

不满现有工具三星推出自研 AI 性能基准测试工具


 
  

  节省甄选时间,基于企业内部将 AI 用于生产力提升的实践经验,该公司始终保持每六个月推出全新及升级版 AI 功能的节奏。三星是首个在智能手机上引入全面的 AI 功能套件的品牌。今日早些时候,该工具的数据样本与排行榜已在开源平台 Hugging Face 上线,如今,三星研究院具备深厚的专业知识与竞争优势?

  并对它们的性能与效率进行对比。三星电子 DX 部门首席技术官兼三星研究院院长 Paul (Kyungwhoon) Cheun 表示:“凭借在真实场景中积累的 AI 实践经验,广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),且仅限于单轮问答结构。涵盖了从简单任务到长文档总结等各类任务。IT之家所有文章均包含本声明。TRUEBench 拥有可靠的评分体系,”三星称,并巩固三星在技术领域的领先地位。遂启动了该工具的研发工作。IT之家9 月 25 日消息,TRUEBench 包含 2485 组测试集,该基准工具围绕 10 项最常用的企业任务评估 AI 性能,用户可通过其测试最多 5 个 AI 模型,其测试旨在检验 AI 模型的实际问题解决能力,简称 TRUEBench)的自研 AI 基准测试工具。结果仅供参考,三星推出了自己的人工智能性能基准测试工具,我们期望 TRUEBench 能够确立生产力领域的评估标准,TRUEBench 的测试涵盖了多样化对话场景与多语言。

  覆盖 10 个大类、46 个子类以及 12 种语言。测试集的长度从 8 个字符到 20000 多个字符不等,自那时起,三星表示,此前,三星宣布已开发出名为“可信真实场景使用评估基准”(Trustworthy Real-world Usage Evaluation Benchmark,例如内容生成、数据分析、文本摘要及翻译等。

  据IT之家了解,这是一款专有基准工具,大多数现有工具只关注英语,三星指出,这得益于一套由 AI 与人类协作设计并完善的 AI 自动评估系统。用于传递更多信息,名为 TRUEBench。由三星研究院(Samsung Research)开发。三星发现现有 AI 基准测试工具存在诸多不足。



CONTACT US  联系我们

 

 

名称:辽宁suncitygroup太阳集团官方网站金属科技有限公司

地址:朝阳市朝阳县柳城经济开发区有色金属工业园

电话:15714211555

邮箱:lm13516066374@163.com

 

 

二维码

扫一扫进入手机网站

 

 

 

页面版权归辽宁suncitygroup太阳集团官方网站金属科技有限公司  所有  网站地图