温馨提示:此页面由第三方提供! 乐修号自营维修号码:4OO-966-8255

AI早报 | 梁文锋等发表DeepSeek V3回顾性论文;MiniMax最新语音大模型超OpenAI|界面新闻 · 科技

更新时间:2025-05-17 20:12 alababa 14

OpenAI拟协助阿联酋建设全球最大数据中心之一

5月17日消息,OpenAI正计划协助阿联酋开发一个超大规模数据中心,该项目有望成为全球最大数据中心之一。据知情人士透露,这家ChatGPT制造商将成为阿布扎比近期公布的5吉瓦数据中心园区的主要锚定租户。虽然OpenAI的参与尚未最终敲定,但官方声明可能于近期发布。

该巨型设施占地10平方英里(约26平方公里),耗电量相当于五座核反应堆,规模远超OpenAI及其竞争对手现有规划。知情人士称,5吉瓦电力将由多家企业共享。

梁文锋等发表DeepSeek V3回顾性论文

5月16日消息,近日DeepSeek创始人梁文锋等人发表了一篇名为《Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for Al Architectures(深入了解DeepSeek-V3:人工智能架构硬件的扩展挑战与思考)》的回顾性论文,深入分析了DeepSeek-V3/R1模型架构及其人工智能基础架构,重点介绍了一些关键创新,如提高内存效率的多头潜意识(MLA)、优化计算与通信权衡的专家混合(MoE)架构、释放硬件能力全部潜力的FP8混合精度训练,以及最大限度降低集群级网络开销的多平面网络拓扑结构。

MiniMax最新语音大模型超越OpenAI,取得国际评测榜单第一

AI早报 | 梁文锋等发表DeepSeek V3回顾性论文;MiniMax最新语音大模型超OpenAI|界面新闻 · 科技-第1张图片-乐修号

5月16日消息,MiniMax近日发布新一代语音大模型Speech-02。该模型在两项国际权威语音评测榜单Artificial Analysis和Hugging Face TTS Arena 上,超越OpenAI、ElevenLabs等获得双榜榜首。

据介绍,Speech-02在字错率WER和相似度SIM等语音模型核心技术指标上取得了SOTA结果。

Manus推出图像生成功能

Manus当地时间5月15日宣布推出图像生成功能,其核心在于其智能任务执行能力。用户只需提供高层次的目标或描述,例如 “为新产品设计营销海报” 或 “创建科幻风格的游戏场景图”,Agent便会自动分析需求,制定执行计划,并调用图像生成模型及其他必要工具以完成任务。

官方表示,这一功能依托 Manus 的多代理架构,通过专项子代理协同工作,确保输出结果精准契合用户意图。

百度AI搜索上线首个基于百亿级内容库的DeepSearch

5月16日消息,百度AI搜索日前推出国内首个基于百亿级内容库的深度搜索(DeepSearch),并上线了个人知识库、创作画布等创新功能。本次同时升级了个人知识库和创作画布等多项创新功能,支持例如行业报告文档分析、工作报告、制作网页等内容创作需求。目前,上述功能已面向全体用户免费开放。

腾讯混元发布毫秒级响应实时生图大模型Hunyuan Image 2.0

5月16日消息,腾讯混元发布业内首个毫秒级响应的实时生图大模型Hunyuan Image 2.0(参数规模提升数10倍),支持文本、语音、草图等多种交互方式。只需一句话、写一个prompt或是画一笔线稿,图像就能同步生成,更具写实质感。

Hunyuan Image 2.0基于单双流DiT架构,提升生成效率,同时对图像质感做了系统性重构。此外,Hunyuan Image 2.0引入多模态大语言模型(MLLM)作为文本编码器,配合自研的结构化caption系统,可理解语义并推测画面表达意图,再一步步拆解画出。

文远知行在阿布扎比开启纯无人Robotaxi试运营

5月16日,文远知行WeRide(Nasdaq: WRD)宣布,在阿布扎比开启纯无人驾驶Robotaxi试运营,打造中东地区第一支纯无人Robotaxi车队。从2025年第二季度起,文远知行的Robotaxi车队将在阿布扎比公开道路开展没有安全员的纯无人试运营。

同时,文远知行Robotaxi在阿布扎比的服务范围进一步扩大,新增玛丽亚岛(Al Maryah Island)和瑞姆岛(Al Reem Island)等阿布扎比出行高需求区域。

抱歉,评论功能暂时关闭!