亿正策略
微软AI(Microsoft AI,MAI)周四(8/28)发布两款自制AI模型,分别是语音生成模型MAI-Voice-1与基础模型MAI-1-preview。前者已集成至Copilot Daily、Podcasts与Copilot Labs,后者则于LMArena进行公开测试,并将逐步导入Copilot文本应用。
其中的MAI-Voice-1在单个GPU上不到1秒就能生成1分钟的语音,标榜拥有自然的声线,带有情感及抑扬顿跌亿正策略,同时支持单人或多人对话场景。外界认为MAI-Voice-1的问时代表微软想把文本助理进化成语音伙伴,让用户不只是看文本,而是能听到更自然的交流。
MAI-1-preview则是个基于混合专家(MoE)结构的模型,可于不同任务中调用专有模型,借由数据挑选及开源技术,它仅以1.5万颗的Nvidia H100 GPU进行训练,远低于采用10万颗以上GPU的xAI Grok。MAI-1-preview的专长为指令遵循,可用来回答日常问题。
MAI负责人Mustafa Suleyman在接受Semafor采访时解释,微软是全球最大的公司之一,需要内部能力来创建顶级模型,原因包括AI在未来数十年的战略重要性令微软不得缺席,且微软也想要更多的模型选择权。Suleyman表示,未来微软会持续强化与OpenAI的合作关系,这并不代表双方的关系会疏远或冷却。
此外亿正策略,MAI也已经着手开发下一代的MAI-2模型,它的规模更大,设置将有所调整,可能会利用微软正在创建的超大型GB200/GB300集群进行训练。
摩根证券提示:文章来自网络,不代表本站观点。