magic data-ag娱乐官网官方网站

发布时间 : 2021-08-09 阅读量 : 584

在数字经济快速发展的时代，数据成为生产要素，算力成为重要生产力，推动各大行业数字化转型和生产力变革。以数据、算法和算力“三驾马车”驱动的人工智能，正在改变基础学科和各个行业的创新模式。鼓励ai开发者积极创新，引领时代发展，是应对未来社会变革的必然要求。

由北京magic data、中科院声学所和江苏师范大学主办，magichub.io开源社区、上海白玉兰开源开放研究院、华为mindspore社区、英特尔openvino中文社区协办的“对话式ai语音识别及说话人识别（asr&sd）挑战赛”自开展以来已经收到四十多个来自各大高校和企业参赛队伍注册报名。报名通道于8月6日关闭，主办方正式开启下一阶段的赛程，8与7日正式向参赛队伍开放开发训练集和基线系统。

开发训练集

主办方针对赛道一“对话场景下的语音识别（asr）准确率”和赛道二“对话场景下的说话人识别（speaker diarization）准确率”开放了以下训练数据集： 1.160小时中文对话数据，主办方通过邮件形式将下载链接发送到参赛者邮箱，下载时间为8月7日~8月9日24时止，请参赛者及时查收和下载。 2.magicdata开源的755小时asr中文朗读数据，请参赛者登录magichub.io开源社区并注册社区账号进行数据集下载，下载地址为： 3.此外，赛道二sd赛道允许使用两个开源数据集：[voxceleb data (openslr-49)]，下载链接： corpus (openslr-82)] ，下载链接：。

基线系统介绍

github上基线系统教程

为了帮助参赛者快速、高质量完成模型开发和训练，主办方提供了基线系统，提供给参赛者使用。我们基于 kaldi 与 espnet 等开源工具与项目搭建了简易的基线系统，赛道一asr 赛道的基线系统我们使用了端到端系统，用 conformer 对北京magic data提供的160小时中文对话数据和开源的755小时asr中文朗读数据进行了训练。赛道二sd赛道上，我们使用了 vbhmm-xvector 系统，训练时加入了 voxceleb 与 cn-celeb 数据集，从而实现说话人特征的提取。详细的使用教程请见：

基线系统答疑指导

参赛者在比赛过程中，对基线系统有任何问题，可在以下链接中提交：。

竞赛主委会支持团队

参赛者在挑战赛中遇到相关问题，可通过发送邮件至ncmmsc16th@163.com邮箱，邮件标题为“asr&sd挑战赛疑问”，由组委会的以下资深技术专家提供专业技术问答和指导：

竞赛主委会支持团队

指导专家们均是在语音界积累丰富的研究和实战经验，在他们的指导下，相信会给参赛者带来不少启发。

荣誉｜magic data获评中国电子联合会「2022智慧赋能名牌企业」

2023年4月15日，中国电子信息行业联合会在武汉首届中国软件创新发展大会上，发布了“2022年智慧赋能名牌企业”。北京爱数智慧科技有限公司（magic data）荣获“创新成长型”智慧赋能名牌企业。获奖企业是围绕智慧赋能基础关键技术、智慧赋能应用关键技术、智慧赋能ag旗舰厅官方网站的解决方案三个方向，重点突出企业研发投入和创新成果、市场占有率和品牌持续性、企业规模和成长性、服务质量保障及企业特色性，遴选的典型及成长新锐企业。

案例｜智慧教育：用ai训练数据打造领先教育科技产品

用科技赋能教育是近年来教育领域中备受关注的话题。科技在教育领域中的应用，可以帮助教育者更加高效、个性化地实现教学目标，同时提高学习者的学习效果和体验。智慧教育项目集成各种先进的ai技术，例如语音识别和自然语言处理等，来实现个性化推荐、智能评估和自适应学习等功能。本文将介绍我们的客户如何通过打造英语口语智能评分系统为智慧校园注入活力。

案例｜智慧金融：借助ai训练数据打造全新数字员工

彭博近日发布了金融领域大语言模型：bloomberggpt，500 亿参数语言模型（*）。数字化、智能化转型正在各行各业全面铺开，人工智能等技术加速向金融业渗透，保险从业机构保持技术的敏感度，持续提升创新能力，不断挖掘增量市场，以应对科技发展带来的挑战和机遇。magic data作为领先的ai数据ag旗舰厅官方网站的解决方案提供商，深耕对话式人工智能领域，期待能在未来持续为行业客户提供数据侧支持，从数据科学的专业视角赋能客户的数智化转型。

张晴晴：对话数据推动aigc——大模型底层数据探索

“training data is technology” .数据即科技，openai的联合创始人ilya sutskever在与知名科技媒体the verge访谈中提到。chatgpt自发布以来热度席卷全球，一周前惊艳亮相的gpt-4更是让人感叹我们迎来了ai发展的历史性时刻。然而我们也困惑，openai为何不开源gpt-4？在我们看来，更多的奥秘或许存在于数据之中......本文是magic data创始人兼ceo张晴晴博士关于数据、大模型与生成式ai的观点分享。

客户案例｜多人会议对话数据集助力高效迭代智能在线会议功能

数字化时代，传统的会议ag旗舰厅官方网站的解决方案已经无法满足高效协同需求，企业对于多端、多人、多元场景线上协作效率有了更高的要求。本期客户是国际知名通讯和协作ag旗舰厅官方网站的解决方案企业，其业务重点之一是向企业用户提供稳定高效智能的线上会议沟通工具。

magic data-ag娱乐官网官方网站

即刻与 magic data 建立联系？