新浪安徽

分论坛| 讯飞开放平台技术产品嘉年华，对话AI背后的造梦师与实践家

2022-10-12 17:20新浪安徽评论（人参与）

　　原标题：分论坛| 讯飞开放平台技术产品嘉年华，对话AI背后的造梦师与实践家

　　11年前，科大讯飞创新性搭建了人工智能开放平台，让技术像水和电一样，方便开发者简单接入，按需取用。

　　11年间，入选首批国家新一代人工智能开放创新平台，现已开放 441项技术能力，链接超365万生态伙伴。

　　10月26日上午，1024开发者节行业峰会‘讯飞开放平台技术产品嘉年华’邀请到陪伴平台成长的一群行业伙伴及开发者，面对面分享讯飞在语音、视觉、认知等人工智能技术方面的研究进展与实际应用。现场同时邀请到讯飞人工智能技术背后的一群造梦师和实践家，分别是科大讯飞研究院院长胡国平、讯飞AI研究院副院长江源、讯飞研究院高级研究员殷保才、讯飞研究院高级研究员盛志超、讯飞研究院高级架构师金豪以及讯飞开放平台产品总监丁瑞，欢聚一堂共话AI。

　　▲ 科大讯飞研究院院长胡国平

　　胡国平院长首先发表开场致辞。很多开发者都是从语音技术开始了解科大讯飞，讯飞深耕智能语音技术20余年，拥有多项国际先进技术成果，致力于用人工智能与语音技术不断为各行各业赋能。

　　以“讯飞语音技术最新进展和产品落地”为主题，讯飞AI研究院副院长江源现场讲述了科大讯飞AI研究院的发展历程，分享了前端处理、语音识别、语音翻译、语音合成等讯飞语音技术的最新进展和应用实践，如基于热词/领域语言模型动态自适应解码的端到端语音识别系统，端到端多语种识别统一混合建模框架，联合语音识别+说话人识别的分离框架等先进技术，江源表示，只有长期的技术沉淀才能让一切看起来so easy！

　　▲ 讯飞AI研究院副院长江源

　　近年来，图像识别水平的快速提升推动了人工智能的热潮。图像识别技术的突破不仅提高了计算机对人脸、文字、指纹及生物特征、医学图片等识别的准确率，而且进一步推动了安全监控、智慧农业、智能制造等多领域的发展。从图文分析通用技术演进、文档结构化、屏上自由写，到人脸识别、全轨迹检索、姿态动作理解、多模态感知、视觉交互、手势交互，以及多模态感知、基于人像融合实现个性化虚拟形象合成等方面，讯飞研究院高级研究员殷保才带来了讯飞在视觉研究技术中的最新进展和应用实践、行业赋能情况演讲。

　　▲讯飞研究院高级研究员殷保才

　　讯飞研究院高级研究员盛志超在现场深度解读了科大讯飞最新认知技术产品。近两年来预训练模型广受关注，基于实际任务特性，2020年8月27日科大讯飞基于Mac-BERT预训练模型，在权威自然语言理解评测GLUE中登顶榜首。他谈到，行业场景多、知识依赖性强、投入大验证周期长、效果风险不可控等因素决定着认知技术落地过程依然“复杂”，因此目前主要是用来提供给开发者满足具体场景应用的标准化可交付的技术。通过分享讯飞认知技术架构、以场景化产品融合认知技术与落地经验，盛志超表示，认知落地绝非是单个技术问题，往往是一个解决方案！

　　▲讯飞研究院高级研究员盛志超

　　随着人工智能与各行各业加速融合，越来越多开发者迫切需要端云一体、能效合一的AI开发平台。讯飞AI平台架构师金豪，现场解读了AI平台工程化范畴，通过分析AI算法工程化普遍痛点，提出算法与工程化解耦的平台化构想。科大讯飞推出专为AI算法工程师打造的无服务、全托管式AI引擎平台，通过插件式开发快速实现AI引擎云/端服务化。以云托管、端托管架构、AI协议标准化作为关键设计，进一步降低开发门槛，提升一致性，具有集成快、上线快、应用快、自主可控等关键特性。通过千亿级PV的打磨、云原生架构与SRE双轮驱动，为开发者们提供先进的技术与服务保障体系。