8月15日,讯飞星火认知大模型V2.0升级发布会如约而至,科大讯飞董事长刘庆峰、研究院院长刘聪重磅发布代码能力和多模态能力升级,同时发布并升级搭载讯飞星火认知大模型V2.0能力的多项应用和产品。刘庆峰表示,代码能力是支撑认知大模型智慧的关键维度,多模态能力则是实现通用人工智能的必经之路也是科大讯飞既定的人工智能技术长期战略,大模型赋能个体和行业的大未来正在到来。
技术获得重大突破的同时,搭载讯飞星火认知大模型核心能力的应用和产品也越来越丰富:既有代码快速生成或者改Bug的智能编程助手iFlyCode1.0,能够进行视频创作的讯飞智作2.0,还有帮助教师设计教学活动、一键生成课件的星火教师助手,面向学生口语练习的星火语伴2.0,讯飞AI学习机也升级AI编程空间和AI创意画板。此外,科大讯飞还和华为联合发布讯飞星火一体机,为每一家企业提供专属的大模型,联合打造全国产化算力底座。
至今,讯飞星火已陆续在教育、办公、汽车、金融、工业、医疗等行业推进真实可见的应用落地,同时也和开发者一起持续构建通用人工智能新生态。
“关于未来,无论你觉得行还是不行,你终将都是对的”,科大讯飞董事长刘庆峰表示,要打造每个人的AI助手,释放每个人的无限可能。
一、 人人都是开发者! 讯飞星火突破代码能力并发布智能编程助手 iFlyCode
代码生成、自动纠错 ,讯飞星火代码能力升级
代码是大模型硬碰硬的能力,此次升级也是科大讯飞今年5月6日首发讯飞星火认知大模型时立下的里程碑。
“代码数据能提升认知大模型的‘智慧’,代码能力是认知大模型聪明程度的重要标志。”刘庆峰说,代码能力也是构建和链接数字世界的有效手段,可以大幅降低数字经济的创业门槛和成本,不用个个都是编程高手,只要发挥自己的想象力、基于对应用场景的认知,就可以提升开发效率、实现相关创业。
此次讯飞星火2.0对代码能力进行5个维度的升级,包括:代码生成、代码补齐、代码纠错、代码解释、单元测试生成。
现场演示中,使用Python画红色的心形线、画出马鞍面方程三维立体图并设置渐变色、用代码生成小游戏对讯飞星火都不在话下,“使用python处理视频星火。m4v,提取其中第2到10秒,把画面缩小一半,加速5倍,保存成gif图片。”就连利用小视频做表情包这种需求都可以迅速搞定。
刘庆峰介绍,根据OpenAI构建的代码能力公开测试集HumanEval,星火V1.5 Python语言的效果只有41分,V2.0已经到了61分、接近ChatGPT。根据认知智能国家重点实验室构建的代码的真实的场景使用的测试集,代码生成和补齐维度上已经超过了ChatGPT。根据计划,讯飞星火代码各维度的能力将在今年10月24日超越ChatGPT,明年上半年对标GPT-4。
讯飞星火智能编程助手 iFlyCode上线,编码效率提升30%
讯飞星火代码能力升级后如何让开发者们更方便使用?科大讯飞现场发布了讯飞星火的应用级产品——智能编程助手iFlyCode1.0。
去年科大讯飞全球1024开发者节期间,用两个手指捏合就能写字的“凌空手写”功能惊艳了不少人,对iFlyCode来讲,开发这个功能简直就是“小菜一碟”,刘聪现场简单几步Prompt完iFlyCode界面后,一行代码都不用写,“凌空手写”功能就已马上实现,而在以前,即便是有经验的工程师,也要半天到1天才能完成,现在只需要几分钟。
根据讯飞内部研发效能平台对2000余名员工在1个月内测试使用iFlyCode1.0的成效数据统计,在一些典型场景中,代码采纳率达30%,编码效率提升30%,综合效率提升15%。
教育数字基座搭载讯飞星火2.0 “零代码”能力也能建设数字化校园
讯飞星火代码能力的升级,一方面是帮助专业的程序员提升效率、将自己从繁琐的事务性工作中抽离出来去发挥更大的创造力价值,另一方面则是帮助非专业的“小白”零门槛进入代码世界。
发布会上,科大讯飞发布了代码能力的行业应用案例:“零编程基础”的老师也能使用教育数字基座作为开发助手,满足学校管理数字化转型中的个性需求和定制开发。
“请帮我搭建一个离校管理应用,家长可以帮学生申请离校,申请信息需要经过班主任审批。”只需要简单指令便可在数字教育基座上完成应用搭建;家长请假语音输入后变成自动生成请假条,班主任在线审批,任课教师同步可在班牌上看到今天请教的同学名单;还可根据需求完成限定条件下的离校生统计。
“教育数字基座致力于构建‘数联、物联、智联’为一体的教育应用开发生态,是数字化校园发展的未来趋势。”根据上海、湖北等试点学校的应用成效,教育应用的开发周期和投资成本都大幅度降低。
刘庆峰表示,代码能力不仅应用于讯飞教育数字基座,还广泛应用于医院、大学、企业、政府等不同的机构,通过iFlyCode实现快速搭建和低成本迅速呈现,“这就是我们说的通用人工智能为什么会深刻改变今天以人力和时长为主要逻辑的商业模式,实现整个产业的彻底的颠覆和升级”。
二、 多模态能力再升级 ,讯飞智作2.0让视频生成更高效
拍了美图想“秒速”发一个图文并茂的朋友圈?张嘴就想画出脑海里突发奇想的图画?只要输入一段文字,一键就想生成声情并茂的小视频?
这些功能,讯飞星火V2.0全部可以实现。发布会现场,刘庆峰对讯飞星火的多模态能力进行重磅发布,讯飞星火在图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面全新升级。他表示,“讯飞星火的多模态能力在业界可测的大模型中明显领先。”
刘聪现场继续真机实测,让星火大模型现场“读图”,生成人物、风景等各类照片,生成班级手抄报,还能根据古诗词“作画”,“智商”在线。星火还能进行虚拟人短视频的生成,“创作一篇立秋抒情散文,并用一个短发民国风的女生形象生成视频”,他话音刚落,一个身穿民国风格的女生站在不断切换的秋天美景前娓娓道来。
对于升级多模态能力,刘庆峰重点介绍了两点。“多模态能力是赋能行业的刚需,也是实现通用人工智能的必经之路。”他强调,当前多模态能力已广泛应用在教育、医疗、工业、汽车、机器人等领域,它可以从真实世界获得越来越多的数据,在产品终端有学习、训练和提升,包括更柔性更自主的工业机器人、更好的自动驾驶、走入家庭的陪伴机器人等。
“多模态能力也是科大讯飞既定的人工智能技术长期战略。”最近3年,科大讯飞已在多模态领域获得了17个国际权威评测冠军,2022年初讯飞就已发布了包括多模感知、深度理解、多维表达、运动智能等核心能力的“讯飞超脑2030计划”,让懂知识、善学习、能进化的机器人走进每个家庭。“这其中最重要的一项技术就是多模态能力。”
多模态能力的升级也将为AIGC带来前所未有的产业机会,发布会上多模态能力升级后的产品——讯飞智作2.0也正式发布,无论是视频的后期处理还是创意视频生产,搭载了讯飞星火核心能力的讯飞智作2.0都能轻松搞定。
现场,刘聪使用讯飞智作进行虚拟人短视频生成、视频创作,“写一段黄山毛峰宣传文案,包括茶叶的产地、包装、色泽等特点”,刘聪又设定一位徽州古风女主播呈现,一个推介黄山毛峰的短视频就马上生成。
讯飞智作2.0可以进一步降低短视频制作的门槛,满足更多元的视频制作需求,推动AIGC产业的发展。
三、 发布教师助手、上线星火语伴2.0,星火打造每个人的AI助手
“备考搭子”来了!星火语伴2.0上线口语模考沉浸式陪练
面向各学段学生、商务人士等广大英语学习爱好者的口语陪练老师,科大讯飞在6月9日发布了讯飞语伴APP。本次结合多模态能力,讯飞语伴2.0全新升级,除了能够进行主题对话、虚拟人对话,重点推出两大核心能力——口语模考和情景交流,可用AI实现真人式陪练。
刘聪现场和讯飞星火语伴2.0进行了一场代入感极强的口语模拟考试,他进入星火语伴的雅思考试入口,一位AI英语老师便跟他展开对话,对话结束后,系统马上给出准确度、流畅度、语法、词汇等维度的系统性评价,并推荐相关课程,通过及时反馈来强化学习结果。
据了解,目前口语模考功能已支持CET、雅思、托福等大型权威考试。
此外,8月15日,讯飞输入法“AI创作助手”正式开启内测。AI创作助手可在办公、学习、生活、社交等多个领域为用户提供场景化文案服务;还能对各类文案进行智能创作、润色,支持多种风格一键切换,提供更智能、便捷、有趣的输入体验。
设计教学活动、一键生成课件 ,星火要做教师好帮手
在“双减”前提下,全国的教育开始实现以核心素养的培养为重点的教育“三新”(即新课标、新教材、新高考)改革,这对老师提出了较大挑战,主要体现在单元教学的规划,教师的教育工具和个人的眼界知识面有限,教学活动过程中丰富资源也很难找到,需要6小时才能制作一个像样的单元课件,面对创新难、资源少、负担重的教学设计难题,如何应对“三新”改革带来的挑战?
科大讯飞全新发布的星火教师助手,支持教学设计的三大环节,创新规划单元教学设计、启发创设情境教学活动、一键生成互动教学课件,大大提升老师的备课效率。
刘聪现场演示了老师如何快速生成并修改教学设计,当他给出提示词“围绕‘时代品质、工匠精神’主题,生成高中语文必修(上)第二单元的教学设计”,一份逻辑清晰、细分成4个任务8个课时的教学设计马上生成,通过提示词就可以直接修改细节,还能一键生成参考课件PPT,为PPT配上风吹稻浪、小鸟鸣叫的背景音,并秒速总结输出思维导图,布置实践作业。
搭载了讯飞星火认知大模型的教师助手,通过数据驱动因材施教,用人工智能助力课堂创新,至今已服务全国超过2.5万所学校、超过1200万名师生。“星火教师助手帮助每个老师解放备课生产力,释放学生想象力”,刘庆峰说,星火教师助手带来的绝不仅仅是效率的提升,它可以帮助孩子获得超越老师自身知识面的素材库,帮助孩子释放想象力和带来更加丰富的课堂。
发布AI编程空间和AI创意画板 ,讯飞AI学习机再升级
讯飞星火发布以来,全面赋能C端硬件,今年“618”期间销售额同比增幅达125%。今年5月6日以来,讯飞AI学习机搭载星火发布的五大功能广受好评,包括TalkTalk口语对话、AI 作文助手、数学互动辅学、百科问答助手、亲子教育助手,讯飞AI学习机销量也实现同比增长180%。
在星火大模型2.0加持下,讯飞AI学习机此次也升级了两大功能,正式发布了AI编程空间和AI创意画板,更贴近新课标要求,全面赋能学科学习和素养拓展。
AI编程空间是学习机行业首款AI一对一智能编程助手,支持Python语言的学习、练习以及代码自动生成、修改、运行调试等功能。通过知识问答、练习题和代码诊断等步骤,在AI一对一互动的过程中,让孩子逐步爱上编程。
AI创意画板不仅可以看懂孩子画了什么,还能理解孩子想要表达的情感和意义,通过鼓励式探讨,不断提升孩子们的观察力、想象力、创造力和表达能力。
在星火大模型加持下,讯飞翻译机也为用户带来了全新的“AI口语”功能,使得用户能够在线体验中英口语对练功能。目前,“AI口语”支持73个不同场景的话题,包括出游、办公礼仪、自我介绍等等,覆盖绝大多数常用口语学习内容。
此外,今年星火大模型发布以来,在汽车、金融领域也取得丰富的成果,如在汽车场景推出了星火汽车助力和星火汽车APP,首款搭载星火的奇瑞汽车即将发布。下一步星火将赋能千行百业,助推产业升级。
四、星火一体机重磅发布!科大讯飞牵手华为联合打造国产化算力底座
今年7月6日,科大讯飞公布讯飞星火将与昇腾AI强强联合,打造基于中国自主创新的通用智能新底座。此次发布会,科大讯飞与华为强强联合发布星火一体机,让企业可以在国产自主创新的平台上,更方便、更自主、更安全可控地私有化部署大模型。
刘庆峰说:“认知大模型深度赋能时代已经到来,健康发展急需构建安全可控保障。”他认为,认知大模型在行业深度应用有三方面的关键要素:
第一是安全可控,“通用人工智能改善民生、赋能社
发展要根植在自主可控、算力安全平台上。”
第二是场景驱动,“要能够在看得见摸得着的场景上,能够产生实实在在的应用价值,能够用统计数据来证明应用成效。”
第三是专项训练,“构建私有化专属大模型,保护用户的专有数据和知识产权,并提升行业应用效果。”
在安全可控方面,刘庆峰介绍科大讯飞和华为已在联合攻关算力卡脖子的问题。科大讯飞拥有自研大模型训练平台,具备训练和数据闭环全流程设计、大模型训练和推理一体化设计、大规模异构算力兼容、支持混合云架构易拓展等优势,华为基于昇腾AI基础软硬件的高算力AI芯片、高性能算子库、多卡高速互联、分布式存储等优势,“我们正在跟华为一道打造面向超大规模大模型的训练国产算力的集群,形成集群化的优势。”
会上,讯飞星火和华为昇腾联合发布了星火一体机,该设备可提供对话开发、任务编排、插件执行、知识接入、提示工程等5种定制优化模式,以及办公、代码、客服、运维、营销、采购等10种以上即开即用的丰富场景包,支持3种模型尺寸供用户选择。刘庆峰表示,有了这些能力,就可以使得每一家企业、每一个行业、每一个学校、每个医院都有机会构建自己的专属大模型。目前,讯飞星火已完成的在金融、政务、汽车等领域的9个专属大模型的数据显示,在场景任务优化和私域知识增强等方面平均效果能够提升20%。
五、 进一步开放助手生态、插件市场、星火营,共建星火生态
“中国人工智能的发展绝不是单个企业、单个科研院所使命,而是整个社会的机会,生态的发展决定了产业的繁荣。”刘庆峰发布会上表示,讯飞星火5月6日发布以来,100天间开发者数量同比增长282%,开发者行业分布中排名第一的是“企业服务”,“说明大模型真正开始赋能到刚需应用中。”
除了原有的能力开放、行业共建、双创赋能等举措,此次发布会上科大讯飞宣布将进一步开放助手生态、插件市场、星火营,与开发者团队一起构建通用人工智能新生态。
据悉,在讯飞星火中目前已有4109个助手开发者团队开发出7862款星火助手,“我们希望通过通用人工智能极大降低社会的创新创业门槛。”此外,讯飞星火营则将与高校联合培养通用人工智能领军人才,与开发者共建技术交流平台。
今年5月6日首次发布讯飞星火大模型时,科大讯飞便公布了今年的升级里程碑,随后如期在6月9日、8月15日分别发布的讯飞星火V1.5和V2.0,今年10月24日将全面对标ChatGPT,中文超越、英文相当,明年对标GPT-4。
为什么总能如约而至?刘庆峰说,这是科大讯飞过去24年创业过程中的技术积淀,星火的每一行代码、每一个算法模块都是自研的;还有成建制的团队,和华为这样的深度合作伙伴。“最重要的是一定要有不完成任务绝不服输的精神,要做就永争第一的坚持。”
“关于未来,无论你觉得行还是不行,你终将都是对的!”刘庆峰说,要全力以赴、不遗余力、充满激情、充满斗志的去争取,“有‘最终一定行’的精神指引,借助这一波通用人工智能的机会,我们打造每个人的AI助手、释放每个人无限可能的梦想,就一定能够成为现实。”