一、模型与技术突破

1.1 通用大模型(大语言模型与多模态模型)

OpenAI:发布GPT-5.5与GPT-5.5 Pro,定位为迄今为止最强大的Agent编码模型。GPT-5.5在Terminal-Bench 2.0准确率达82.7%,SWE-Bench Pro端到端解决率58.6%,超越GPT-5.4;支持智能编码、计算机使用、知识工作和早期科学研究;生成速度提升20%,tokens消耗减少;GPT-5.5 Pro面向Pro/Business/Enterprise用户;API即将推出,上下文窗口400K,支持快速模式(速度提升1.5倍,费用增加2.5倍);与英伟达GB300深度集成,计算效率大幅提升,能自主开发3D动作游戏。

DeepSeek:发布DeepSeek-V4预览版并开源,包括V4-Pro与V4-Flash两个版本。采用混合专家+多重注意力设计,支持100万token级超长上下文;V4-Pro总参数1.6T、激活参数49B,Agentic Coding评测达开源模型最佳水平,推理能力追平顶级闭源模型,世界知识仅次于Gemini-Pro-3.1,数学/STEM/竞赛代码超过所有已公开评测开源模型;V4-Flash总参数284B、激活参数13B,兼顾速度与成本,简单Agent任务素质与V4-Pro旗鼓相当;采用DSA机制优化长上下文处理,降低计算成本;API已同步上线,支持OpenAI ChatCompletions接口与Anthropic接口,支持思考模式与reasoning_effort参数。

腾讯:发布混元Hy3 preview并开源,总参数295B、激活参数21B的MoE架构,支持256K上下文长度。代码与智能体能力大幅提升,在SWE-Bench Verified、Terminal-Bench 2.0等主流基准取得强竞争力;在FrontierScience Olympiad、IMO Answer Bench等高难度理工科推理任务表现突出;已在元宝、CodeBuddy、WorkBuddy、QQ、ima、QQ浏览器、腾讯文档、腾讯乐享等产品上线;支持OpenClaw、OpenCode、KiloCode等开源智能体产品;个人版API最低28元/月。

阿里:开源Qwen3.6-27B,270亿参数稠密多模态模型,支持思考与非思考模式。智能体编程基准全面超越15倍参数量的前代MoE旗舰Qwen3.5-397B-A17B,SWE-bench Verified达77.2,Terminal-Bench 2.0达59.3;支持多模态输入,原生支持视觉推理、文档理解和复杂视觉问答;可在Qwen Studio体验,权重已开源至Hugging Face和ModelScope。

小米:发布MiMo-V2.5全系列开启公测,包含V2.5、V2.5-Pro、TTS和ASR四款模型,均为Agent场景原生设计。Pro版对标Claude Opus 4.6和GPT-5.4,单次可稳定完成近千轮工具调用;用4.3小时从零实现完整SysY编译器(Rust版),通过全部隐藏测试;Token Plan定价优化,取消256K与1M上下文倍率区分,夜间时段8折,即将全球开源;TTS支持"一句话生成新音色",ASR开源支持方言与多语混说。

月之暗面(Moonshot):发布Kimi K2.6开源模型,支持长达12小时以上自主编码会话,可执行超过4000次工具调用;在SWE-Bench基准测试中表现优于Opus 4.6;支持调用图像视频API生成网站视觉内容,生成网站审美表现优于Gemini;支持直接生成GLSL和WGSL着色器代码,构建Three.js场景;结合DFlash技术在8张MI300X显卡上实现5.6倍吞吐量提升(508 tok/s vs 90 tok/s基线)。

蚂蚁百灵:发布Ling-2.6-1T万亿参数旗舰模型,提供试用并计划开源。采用"快速思考"方法,成本降低至同类模型约四分之一;在AIME26和SWE-bench Verified等基准测试中取得最先进结果;支持262.1K总上下文和32.8K最大输出;Ling-2.6-flash总参数量104B,激活7.4B参数,日均调用量超100B tokens,推理速度340 tokens/s,完成同等任务仅消耗15M tokens(约为同类模型的十分之一)。

商汤绝影:发布端侧大模型Sage,总参数32B、激活仅3B。在PinchBench评测中最佳任务完成率达94%,超越Claude Opus 4.6(93.3%)、GPT-5.4(90.5%)等云端旗舰模型;依托自研SCOUT分级协同学习与ERL可擦除强化学习技术,训练算力节省60%、复杂任务完成率提升20%;已在英伟达Orin X平台部署,支持接入OpenClaw等主流Agent框架。

Meta:测试万亿级AI大模型,完全基于国产算力集群训练,目前仅对受邀用户开放。

谷歌:发布Gemini 3.1 Flash,目前表现力最强的语音生成模型,机器说话机械感消失,情感起伏自然;发布Gemini 3.1 Pro深度研究代理,支持MCP协议与多模态输入;Workspace Intelligence全面上线,覆盖Docs、Sheets、Slides和Gmail。

Orq:新模型支持256K上下文与思考模式,SWE-bench Pro得分58.6,API兼容OpenAI接口。

Reka Edge:2603模型现已支持llama.cpp上游运行,可进行本地量化与推理部署。

1.2 垂直大模型(行业/领域专用模型)

OpenAI:开源隐私过滤模型Privacy Filter,基于gpt-oss架构,F1分数达97.43%,可检测和匿名化文本中个人身份信息。

德适生物:发布iMedImage医学影像基座模型,专病AI研发成本降低超90%。

云知声:推出工业级文档智能大模型Unisound U1-OCR,具备性能领先、可信验证等优势。

东南大学:发布全国高校首个纪检监察大模型"清鉴",聚焦政策解读与案例分析,支持私有化部署。

滴滴自动驾驶+清华大学:成立深穹远航实验室,发布STAPO算法,精准剔除约0.01%虚假Token,改善训练效果,应用于自动驾驶端到端模型微调。

浙江大学+上海人工智能实验室:提出IBISAgent生物医学视觉推理框架,将分割任务重新建模为多步马尔可夫决策过程,平均IoU提升35.13%,已被CVPR 2026接收。

上海交通大学:提出Meta-encoder框架,集成多病理基础模型提升癌症检测,在肺癌亚型分类、乳腺癌淋巴结转移检测等任务中显著优于单一最佳基础模型,发表于Nature Communications。

中科第五纪:研发具身世界模型FlowWAM,在WorldArena榜单中夺得双料第一,展示物理遵循和3D准确度卓越能力。

自变量机器人:发布WALL-B模型,全球首个基于世界统一模型的具身智能基础模型,专攻家庭场景动态处理。

智平方+港科大(广州):发布AlphaBrain Platform,全球首个一站式具身智能模型开源社区,集成世界模型、类脑模型、RL Token和持续学习算法;RL后训练参数从3.9B压缩至137M,单张4090显卡即可微调。

MotuBrain:匿名登顶WorldArena(63.77 EWM Score)与RoboTwin2.0(随机场景96.1分),关键维度全面领先。

EOS:发布Nexus v1系统,GSM8K数学推理基准测试准确率达99.70%(1315/1319),零样本推理,完全确定性。

Kronos:金融大模型,训练集横跨全球45家交易所,自回归模型精准预测比特币未来24小时走势。

1.3 专项技术突破

阿里(通义):发布Wan-Image系统,融合语言模型与扩散变换器架构,支持4K超清渲染,复杂排版,多主体身份稳定。

米哈游(Anuttacon/蔡浩宇团队):发布LPM 1.0表演模型,170亿参数,基于扩散Transformer架构,专注虚拟角色实时说话、倾听并做出微表情,支持全双工对话模式;构想用大语言模型负责角色思考决策,表演模型负责视觉呈现,替代传统游戏引擎流程。

南洋理工大学S-Lab:提出MonoArt,从单图生成可动3D模型,渐进式结构推理,推理时间仅需20.5秒,在PartNet-Mobility基准测试中几何重建质量、关节类型预测及运动参数估计等核心指标最优。

VAST AI Research:提出SkinTokens框架,离散化蒙皮权重提升3D绑定精度,蒙皮准确率提升98%至133%,强化学习微调后骨骼预测性能提升17%至22%。

胡渊鸣(Meshy):AI生成3D模型,年经常性收入达4000万美元,月度收入增速20%-30%,毛利率85%,全球注册用户1000万;第六代模型将3D生成与贴图时间压缩至1分钟内,与Bambu Lab、Formlabs等3D打印厂商集成工作流。

字节跳动:发布Seed3D 2.0,几何精度与纹理材质双SOTA,引入Coarse-to-Fine两阶段DiT策略,统一PBR生成模型采用MoE架构并引入VLM先验,支持部件级生成与场景组合,可输出URDF格式兼容Isaac Sim。

Luma AI:发布Uni-1图像模型,采用自回归Transformer架构,区别于主流扩散模型,画面质感、图文混排、角色一致性和空间逻辑表现突出,支持视觉自我审查自动识别不符合要求的生成结果并重新生成。

WorldGrow:开源项目支持生成无限显式三维世界场景。

SOON AI(杭州极逸/恺英网络):游戏创作平台二测开放,支持自然语言生成完整游戏,AP4级代表可上线成品游戏,基于agent-gamedev ECS引擎。

ControlAudio(清华):渐进式扩散建模实现声音事件发生时间和语音内容联合建模,被ACL 2026 Main Conference接收并推荐为口头报告。

SAGA(多机构):Scientific Autonomous Goal-evolving Agent,双层思考机制,在抗生素设计、纳米抗体设计、DNA增强子设计、无机材料设计和化工过程设计五大领域通过湿实验验证。

ProSafePrune(合肥工大+科大讯飞):低秩参数修剪框架,精准定位和修剪模型内部认知偏差,缓解过度拒绝问题,被ICLR 2026接收。

SePT:Self-Evolving Post-Training,无奖励自训练方法提升推理能力。

HY-SOAR(腾讯混元):扩散模型无需奖励模型实现自我纠偏,直接从训练数据中挖掘轨迹级纠正信号,在SD3.5-Medium上实测优于SFT和Flow-GRPO。

SSL-R1:视觉强化学习框架,利用视觉拼图训练,摆脱标注,直接从图像数据中提取奖励。

HyLaR:视觉推理新方案,融合文本表征,DePO算法解决混合空间强化学习难题。

PASTA:针对视觉模型的攻击技术,在视觉变压器任意位置生效,攻击成功率高达99%。

Information Shapes Koopman Representation:多机构联合提出,入选ICLR 2026 Oral。

KAN作者刘子鸣:入职清华,提出Physics of AI理念,KAN架构GitHub获超1.6万星,适用于需可解释性及紧凑规律的任务。

AllenAI:发布BAR架构,支持独立训练领域专家并合并模型,70亿参数规模测试表现优于传统方法。

Sessa:新型解码器架构,将注意力机制融入递归反馈路径,理论证明可实现更慢记忆衰减和更灵活选择性检索。

共轭学习理论:揭示深度神经网络可训练性与泛化机制,基于凸共轭对偶性构建。

埃默里大学+牛津大学+格里菲斯大学:提出大规模智能体系统三维分类框架,解决扩展失稳问题。

ClawLess(南方科技大学+港科大):为AI智能体提供数学级安全防护,将形式化验证的安全策略翻译为底层系统调用拦截指令。

Arc Sentry:开源提示注入检测工具,内部残差流分析实现零误报,检测率92%。

Vaara:开源工具拦截代理工具调用层风险并评分。

SupraWall:开源本地Agent安全层,拦截工具调用并定义代码策略。

Bordair:开源AI安全数据集,整合40多篇论文攻击载荷,50万+样本。

EchelonGraph:推出实时威胁地图,可视化RAG管道配置错误导致的向量端口暴露规模。

1.4 AI框架与工具

GenericAgent:正式开源,3K行代码实现自进化自主Agent框架,9个原子工具覆盖本地系统级控制,Token消耗远低于同类产品。

ml-intern(Hugging Face):开源机器学习工程师智能体,可自主完成调研、代码编写、模型交付全流程,深度接入Hugging Face生态。

Evolver:基于GEP的AI Agent自进化引擎。

M-flow:受生物启发的认知记忆引擎,GraphRAG新范式,LoCoMo、LongMemEval、EvolvingEvents三大评测第一。

AlphaBrain(智平方):全球首个一体化开源具身智能框架。

SePT:无奖励自训练方法提升推理能力官方开源实现。

TileKernels(DeepSeek):基于TileLang的GPU内核库,专为大语言模型运算优化。

InformationKoopman:从信息瓶颈视角解决Koopman算子有限维子空间提取难题。

MonoArt:单目关节物体3D重建官方实现。

Monet:CVPR 2026收录的多模态大模型训练框架,支持生成连续嵌入作为中间视觉思考。

OpenGame(港中文MMLab):端到端网页游戏智能体框架,一键生成完整可运行网页游戏,GameCoder-27B专用模型,搭载Claude Sonnet 4.6时Build Health达72.4。

Flipbook:原型发布,模型直接流式传输像素至屏幕,无需HTML与布局引擎,基于LTX Video模型,1080p分辨率24fps实时交互。

callmux:MCP代理方案,通过批处理与并行执行优化AI智能体工具调用上下文,7次操作批次上下文污染减少约19倍。

mm工具:为编码智能体提供多模态上下文命令行支持,Rust编写核心路径。

Broccoli:开源编码任务自动化工具,支持Linear集成与云端沙箱运行。

XTrace:开源加密向量数据库SDK,支持密文相似度搜索,采用Paillier同态加密与AES-256。

Rasputin:本地自主编码代理,支持多步任务规划与自我修复,qwen2.5-coder:14b模型通过全部8项真实编码任务。

Verantyx:本地macOS AI编程IDE,支持自主修改运行环境。

Euphony(OpenAI):开源工具支持可视化会话日志数据。

Monkey Code:在线编程平台,接入GPT-5.4、GLM-5.1、MiniMax 2.7等模型。

Android Studio Panda 4:集成生成式AI及代理网页搜索功能。

kv-planner:大模型服务容量规划与成本估算工具,支持MCP协议。

Spark Dashboard:监控面板,整合vLLM指标与系统资源状态。

Senni:本地AI伴侣框架,支持Gemma与Qwen模型。

LocalForge:自托管AI控制平面,将GPU工作站转为LLM服务栈。

Milvus CDC(Zilliz):开源组件,支持跨集群主备容灾复制。

RigStack:前CTO开源,优化本地AI推理管理与安全。

Spiral:INT3模型压缩与2位KV缓存,支持Mac M系列。

Unsloth:发布Kimi-K2.6 GGUF量化版本供本地部署。

Cube Sandbox(腾讯云):开源,硬件级隔离沙箱,60毫秒冷启动,兼容E2B接口标准。

Cline:IDE内全自主编程助手,⭐60.3k开源项目,可修改文件、运行终端命令、调用浏览器搜索。

Zilliz:发布全量代码检索插件,MCP协议工具让Claude秒懂全部源码。

微软:开源智能体入门教程,12章教程,⭐59k+。

港中文:开源OpenGame端到端网页游戏智能体框架。


二、智能体与AI应用

OpenAI:发布Workspace Agents,接替GPTs,面向Business、Enterprise、Edu、Teachers订阅用户;支持一句话搭建Agent,可部署到ChatGPT或Slack;具备持久记忆、长流程执行能力;展示软件审批、周报生成、销售外联等五类场景;研究预览期到5月6日前免费,之后转为按token计费的credit模式;发布ChatGPT for Google Sheets插件,通过自然语言操作表格;推出Euphony开源工具可视化会话日志数据。

Claude(Anthropic):宣布Managed Agents内置记忆功能开启公开测试,跨会话学习,文件系统记忆,企业级部署具备范围权限、审计日志和完整程序化控制;扩展Connectors,新增15款日常应用(AllTrails、Instacart、Audible、TripAdvisor、Intuit TurboTax、Booking.com等);推出Claude Cowork配置方案,支持三大云平台部署;Claude Code/ultrareview在远程云沙盒中并行审查PR;Mythos Preview助力Mozilla修复Firefox 271个漏洞;STEM Fellow项目招募各学科专家驻场校准模型输出。

Codex(OpenAI):支持GPT-5.5,实现五大能力升级——浏览器操控、文档能力(Microsoft Office和Google Drive)、计算机使用(Computer Use)、自动审查(Auto-review)、gpt-image-2整合;新增Computer Use、内置浏览器、Chronicle屏幕记忆与90多项插件。

高德:发布汽车出行AI Agent,基于千问大模型构建"语言大脑"和"空间大脑"双引擎,实现主动意图理解,可完成复杂行程的一句话串联及动态路线优化。

百度智能云:搭子DuMate首批通过中国信通院Claw双项认证。

千问:正式对外开放"AI办事"能力,东方航空成为首家接入企业,实现全流程AI购票服务。

天猫超市:发布AI智能体"超喵1.0",覆盖16个经营领域全链路,新品成功率提升至30%。

京东大药房:推出"AI全球找药"功能,依托京东药智模型快速匹配罕见药源。

飞书项目:发布MCP能力、CLI工具及AI应用体系,接口调用量升至2300万次/天。

亿咖通:通过飞书平台提升供应链预测准确率至91.5%。

商汤"大装置"平台:入选Omdia全球原生AI云标杆,系统可用率达99.9%。

蚂蚁数科:DTClaw上线AI支付功能,用户通过语音指令调用支付宝完成付费操作。

Claude for Word:测试版推出,Anthropic半年内完成Office三件套全覆盖。

鸿蒙版飞书:升级,整合会议、沟通、日程、文档等功能。

鸿蒙版闲鱼和点淘:更新,引入AI"一键定价"和"AI买手"功能。

邦德平台:上线,利用AI帮助用户减少屏幕依赖。

Latitude:推出AI驱动角色扮演平台Voyage,支持无脚本叙事与动态角色互动。

QClaw(腾讯):海外版开启内测,支持WhatsApp和Telegram,每日赠送4000万token。

小米龙虾(Xiaomi miclaw):上线PC、Mac和有屏音箱版,支持跨设备联动。

澎湃OS 3 Beta:向小米17系列推送Xiaomi miclaw智能体,支持80+系统工具与跨设备同步。

荣耀:发布YOYO Claw龙虾技术,MagicBook系列笔记本预装,Token消耗降低50%。

联想:发布ThinkPad 2026酷睿Ultra新品及天禧AI 3.7;推出ThinkCentre X系列AI台式机,配备16:18比例可旋转屏幕。

华为:发布鸿蒙座舱AI陪伴机器人"哈蒙蒙",可与小艺实时联动;Mate90将搭载鸿蒙操作系统7.0,端侧AI响应速度提升50%。

Turix CUA:开源计算机操作智能体,获2.3K Star,可自动化操作微信等封闭应用。

Hermes Agent:多智能体协同系统,支持通过飞书发送需求,总管Agent调度多个角色Agent自动完成全流程。

SAGA:智能体框架实现AI科研自主目标演化,横跨五大领域通过湿实验验证。

LinkedIn:推出认知记忆智能体(CMA),构建具备状态感知能力的AI系统,三层记忆架构(情景、语义、程序)。

宇视:发布阳关企业级SOP智能体平台,梧桐大模型新增Skills层,算法开发成本降低40%,算力利用率提升50%。

Cohorte AI:开源企业智能体治理栈,提供可靠性认证与上下文路由功能。

Google:分享将Titanium单体Agent重构为鲁棒管道的四大经验(子智能体架构、结构化输出、动态RAG、可观测性)。

密封测试范式:解决AI智能体修复测试而非代码问题,兼容Qwen、Claude等九种模型。

微软Copilot:日活使用量增长10倍。


三、物理AI/机器人

索尼:AI机器人Ace登上Nature封面,成为首个在竞技体育中击败人类精英选手的物理AI机器人;在ITTF规则下击败3位人类精英选手(共赢7局输6局),对阵日本T.League职业选手7局中赢下1局;由高速感知系统(9台APS相机)、基于强化学习的控制系统和高动态响应机械臂(8自由度,末端速度20米/秒,延迟低于5毫秒)组成;最高450 rad/s旋转条件下回球率超75%。

特斯拉:第三代人形机器人Optimus V3预计年中亮相,2026年夏季投产;Optimus将在弗里蒙特工厂Model S/X产线投产;AI5芯片完成流片,有用算力预计提升至约2000-2500 TOPS。

它石智航:获4.55亿美元Pre-A轮融资,高瓴、红杉联合领投,主攻具身智能大脑,AWE模型勇夺工业装配世界纪录。

智平方:发布AlphaBrain开源平台,全球首个一站式具身智能模型开源社区。

中科第五纪:FlowWAM具身世界模型登顶全球WorldArena榜单双料第一。

自变量机器人:发布WALL-B模型,全球首个基于世界统一模型的具身智能基础模型。

苏黎世联邦理工:在Science Robotics发表观点,提出机器人基础模型需从自主迈向同盟的范式升级,提出6项关键能力建设方向。

2026具身智能趋势:WAM世界模型取代VLA,多场景落地加速;Google DeepMind发布Genie 3实现24fps实时生成交互式三维环境;NVIDIA推出Cosmos Policy;北京大学联合发布WoW世界模型;智元机器人开源全球首个具身世界模型评测基准EWMBench。

Figure 02:已走进真实家庭测试。

特斯拉Optimus Gen 3:剑指厨房精细操作。

农业无人驾驶农机:进入厘米级定位时代。

星灿智能:从自动驾驶转向具身智能,聚焦割草机器人和智能轮椅。

北京理工大学:提出EPA框架,利用事件相机微秒级轨迹信息消除高速运动下的视频伪影。

开源双臂机器人开发套件trlc-dk1:发布,面向AI研发。

Marcel Münch:称深圳聚集超400家机器人公司。

第二届世界人形机器人运动会:将于8月22日至26日在北京国家速滑馆"冰丝带"举行。

猛士汽车+华中科大:联合研发的人形机器人在总装车间投入应用。

中国联通:依托5G-A网络保障2026北京亦庄半程马拉松暨人形机器人赛事。

荣耀机器人:刷新人形机器人半马纪录。


四、硬件与基础设施

谷歌:发布第八代TPU,首次拆分训练与推理双芯——TPU 8t训练性能较上代Ironwood提升2.7倍,单超级节点可扩展至9600芯片和2PB共享内存,引入原生FP4;TPU 8i集成384MB片上SRAM是上代3倍,单位价格性能提升80%,今年晚些时候向谷歌云客户开放。

英伟达:下一代Vera Rubin芯片未发布已获13万颗订单;发布增强版ReSTIR算法,实时路径追踪性能提升2.74倍;发布DLSS 4.5 SDK,RTX 50系列单帧最多生成5帧;发布Jetson平台内存优化方案,量化Qwen3 8B模型可节省约10GB内存。

曦望:发布专为大模型推理定制的GPU芯片启望S3,单位面积算力效率提升5倍以上;国内首家纯推理GPU独角兽,估值超百亿元,成立一年多完成七轮融资累计40亿元。

英特尔:推出至强600处理器与锐炫Pro B70/B65 GPU,AI性能提高17%;一季度营收136亿美元,同比增长7.2%,股价盘后上涨15%;发布智能体PC,结合酷睿Ultra处理器与本地AI算力。

SK海力士:最新季度营收达52.57万亿韩元,营业利润激增405.5%。

寒武纪:2025年营收64.97亿元,同比增长453.21%。

马斯克旗下Terafab:将采用英特尔14A工艺制造AI芯片,SpaceX负责大规模量产。

奇瑞汽车+英伟达:开启全球合作,聚焦辅助驾驶、AI座舱及机器人领域。

OPPO:Find X9s Pro发布,坚持不涨价,12+512GB起售价5299元。

华硕:发布灵耀16 Air与灵耀14 Air骁龙版笔记本,搭载骁龙X2 Elite Extreme,续航分别达21与29.6小时。

联想:ThinkPad X14 AI 2026笔记本发布,整机AI算力180 TOPS。

华为:Mate90将搭载鸿蒙操作系统7.0,结合麒麟芯片NPU。

禾赛科技:发布第五代6D全彩芯片平台及600米超感光雷达。

宁德时代:发布麒麟凝聚态电池,续航里程可达1500公里;发布第三代麒麟电池,"等效10C超充、峰值15C放电";截至2026年2月全球累计搭载其动力电池的新能源汽车销量已超2580万辆;宣布2026年第四季度实现钠离子电池规模化量产;十年研发投入超千亿元,借助AI构建大科学模型。

中国电信:完成全球首个5G-A超轻量化(eRedCap)端网互通商用验证。

北京爱尔达:展出低空气象探测系统与X波段相控阵测雨雷达。

中国第三代自主超导量子计算机"本源悟空":已具备AI运算能力,搭载72位超导量子芯片"悟空芯"。

SpaceX:警告其太空AI数据中心技术未经验证,商业化面临障碍。

高通全球副总裁徐晧:表示6G时代流量需求将达现在的3至7倍,其中超30%由AI驱动。

2026全球6G技术与产业生态大会:在南京召开,预计2030年产业链规模超5万亿元。

德州仪器:音频芯片技术演进,助力AI时代智能硬件交互体验升级。

RTX PRO 6000:用户反馈在llama-bench测试中性能未达预期;双卡部署遇到带宽异常问题。


五、企业动态

OpenAI:拟向DeployCo注入5亿美元股权,合资企业估值达100亿美元,TPG、贝恩资本等合计注资40亿美元;联合Booking.com推出中小企业ChatGPT免费培训课程;宣布当前已锁定总功率超8 GW的算力资源,到2030年将达30 GW;因Codex平台测试环境误推生产,泄漏GPT-5.5、Glacier、Heisenberg、Arcanine等多款未发布模型;CEO山姆·奥尔特曼批评Anthropic的Mythos工具"制造恐慌式营销"。

Anthropic:二级市场估值达1万亿美元,首次超越OpenAI的8800亿美元;对约2%新专业用户测试更贵订阅方案,部分Pro用户Claude Code使用权被砍;无预警切断Belo公司Claude AI权限15小时;从Pro套餐移除Claude Code,称因算力消耗过高;Claude Desktop被指未经用户授权向Chrome等7款浏览器静默安装高权限组件;承认部署后的模型无法完全控制;推出STEM Fellow项目,招募科学家改进Claude模型科研能力,周薪3800美元。

Meta:计划5月20日起全球裁员10%约8000人;启动"模型能力计划"MCI,在美国员工电脑安装追踪软件采集鼠标、键盘及屏幕截图用于训练智能体,CTO确认工作电脑无退出选项;推行"AI构建者"通用岗位头衔;测试"模型能力项目"记录员工键鼠操作;大规模裁员全力冲刺AI。

马斯克/SpaceX:宣布拟以600亿美元收购Cursor,较去年11月估值翻倍,亦可选择以100亿美元建立合作关系;以1.25万亿美元并购xAI;筹备6月IPO目标估值1.5万亿美元;Terafab将采用英特尔14A工艺制造AI芯片。

Cursor:估值从293亿美元飙升至500亿美元;宣布与SpaceX达成合作伙伴关系,利用xAI Colossus基础设施扩展模型智能;20人做到1亿美元ARR。

苹果:CEO蒂姆·库克卸任,约翰·特努斯接任,库克转任执行董事长;公布2026 Apple Scholars in AIML名单,20人中8位为华人;正在研发智能眼镜,计划2027年推出;与谷歌达成协议,下一代基础模型将基于Gemini构建。

谷歌:内部75%新代码由AI生成,较去年秋季的50%提升;联合创始人谢尔盖·布林督导Gemini团队升级AI编程能力;Workspace Intelligence全面上线。

微软:内部AI代码占比约30%;把AI使用计入绩效;Copilot日活使用量增长10倍;展示Copilot升级为企业级智能系统;周大福部署超400个智能体效率提升70%。

Shopify:把AI使用计入绩效。

Perplexity:"强制使用"被更多公司采纳。

GitHub Copilot:暂停新个人订阅,因算力资源压力过大。

美团:秘密试水万亿级AI大模型,完全基于国产算力集群训练,目前仅对受邀用户开放。

上汽荣威:发布家越07概念车,搭载豆包大模型2.0,成为全球首个AI原生汽车序列首款车型;与火山引擎联合发布AI原生序列"家越",搭载AI原生技术架构CPP(Context-Planner-Pixel三层闭环)。

尚界(鸿蒙智行):发布Z7与Z7T两款新车,售价21.98万元起,全系标配乾崑智驾ADS 4.1与巨鲸800V高压平台,27分钟内订单突破1.2万台。

问界:全新一代M9发布,预售价49.98万元起,率先搭载华为乾崑智驾ADS 5系统。

智界:旗舰MPV V9核心安全技术公开。

广汽+华为:联合打造智能猎装车启境GT7,搭载全球首款量产896线激光雷达。

理想:全新旗舰SUV L9 Livis将于北京车展亮相,定价55.98万元。

蔚来:2026款乐道L90开启全国发运,新增激光雷达版型,搭载自研5nm车规级智能驾驶芯片"神玑NX9031"。

吉利银河:推出星耀7,预售11.28万起。

阿维塔:全新车型06T旅行车上市。

比亚迪:王朝网推出宋Ultra EV,全系标配800V兆瓦级闪充技术。

领克:发布领克10及高性能版10+。

星途:发布EX7,售价19.99万起。

梅赛德斯-奔驰:发布全新纯电C级车,WLTP续航达762公里。

千里科技:启动AI战略并推出新品牌"游心",旗下辅助驾驶系统已搭载于17款车型,累计装车超50万辆;与阶跃星辰共建原生智驾基座模型;智驾装车量突破46万辆,计划2026年进入百万俱乐部,2028年达到800万辆。

smart:公布精灵#2概念车草图。

猛士+华为乾崑:宣布深度合作。

奥迪:与Momenta确认E7X SUV将搭载L3级自动驾驶技术;与上汽联合成立奥迪创新技术中心。

大众汽车:发布全域智能体AI路线图,计划从2026年起在CEA架构新车型中全面搭载智能体AI。

华为:乾崑智能驾驶系统累计行驶里程突破百亿公里;发布鸿蒙座舱HarmonySpace 6,智能助手小艺全面升级。

特斯拉:宣布车载语音接入豆包大模型;车机语音大模型在沪完成备案;2026年资本支出提至250亿美元。

淘宝天猫:推出AI识别技术,打击恶意退款伪造图像。

抖音:发布《抖音生活服务AIGC创作规范》,累计下架AI侵权视频超53.8万条,处罚违规账号4000多个。

爱奇艺:推出Nadou Pro平台引发演员反对,AI短剧产业链遭质疑;宣布《灵魂摆渡》首部全AI生成电影定档2026年暑期。

大麦娱乐+阿里通义:发布"妙呀"平台,基于Wan2.7打造首个AI潮玩设计工具。

飞书:多维表格推出新功能,一线工人通过自然语言指令完成数据分析与报告制作。

高德:地图新增"地图影像实景融合"与"航空与卫星洞察"功能。

京东:AI影视创作大赛"十二姬的次元宇宙"AI漫剧赛公布获奖名单。

Yelp:升级AI助手为"数字礼宾",集成DoorDash、Zocdoc。

Adobe:推出企业AI代理产品CX Enterprise,与超30家科技公司合作。

GE医疗北京基地:启用首条"黑灯"生产线,CT探测器实现无人化制造。

南方电网:"柔性灰度智能监测研判平台"落地广西,风险识别效率提升逾50%。

萤石:发布EZVIZ AI Core X智能大模型主机;发布星辰10系列蒸汽洗地机器人。

黑湖科技:服务近4万家工厂,2025年云化生产管理软件市场份额达52.7%,估值70亿元。

奕行智能:完成15亿元B轮融资,加速具身智能技术落地。

级数AI:完成数千万元天使轮融资,推进教育软硬一体化生态。

Vast Data:获10亿美元融资,估值升至300亿美元,英伟达参投。

10x Science:完成480万美元种子轮融资,专注AI解析质谱数据辅助药物研发。

NeoCognition:完成4000万美元种子轮融资,致力于提升AI代理自主学习能力。

贝索斯旗下普罗米修斯AI实验室:推进100亿美元融资,估值达380亿美元。

Sierra:收购YC支持的AI初创公司Fragment,Fragment曾获种子轮200万美元融资。

软银:计划以所持OpenAI股份作担保,获取100亿美元贷款。

Eclipse创始人Lior Susan:筹资13亿美元,用于物理AI领域投资。

Fragment:获种子轮200万美元融资。

它石智航:获高瓴、红杉投资,4.55亿美元Pre-A轮。

Airpost:45天达成200万美元ARR,客户保留率100%。

拓竹科技:将Meshy 6集成至MakerWorld的MakerLab平台。

胡渊鸣/Meshy:年经常性收入达4000万美元,月度收入增速20%-30%,毛利率85%。

Base44:一人6个月被Wix以8000万美元收购。

昆仑万维:2025年营收达81.98亿元,同比增长44.78%。

车讯互联:2025年营收达5.55亿元,AI赋能核心主业收入同比增长203%。

北汽蓝谷:发布2025年财报,营收279.4亿元,同比增92.5%,毛利率首次转正。

大众汽车集团:计划进一步削减汽车产能最多达100万辆。

一汽奥迪:以"油电共进全智"为主题参展北京车展。

鸿蒙智行:宣布全系产品累计交付量已突破135万辆,2026年第一季度交付11.27万辆,同比增长41.9%。

中国长安汽车:宣布整合阿维塔与深蓝品牌,目标到2030年全球销量突破150万辆。

行业价格战:2026年以来已有近70款车型降价,新能源车型平均降幅达3.8万元,行业利润率已从8%下降至2.9%。

3月日系品牌销量:日产中国销量同比增23.0%,丰田降8.0%,本田降34.3%。


六、产品更新

可灵AI(快手):Video 3.0系列加入原生4K模式,可生成15秒、60fps的4K视频并同步音频,迄今支持最大分辨率的AI视频模型;4K模式提供院线级清晰度与色彩层次;所有订阅用户和团队计划用户享受4K生成20%折扣。

HeyGen:推出Instant Highlights V2,视频高光片段自动提取剪辑成片,支持多演讲者处理、人脸追踪、175种语言翻译、4K导出。

Topview:推出Ultra Plan计划,结合GPT-Image 2进行故事板创作,再传递给Seedance 2.0渲染。

DistilBook:将PDF论文转化为动画解释视频。

Buzzy:推出自然语言视频编辑功能,支持人物替换与背景修改。

Imagine平台:推出视频生成工作流,支持图生视频与数字人制作。

FocuSee 2.0:支持手机录屏、3D动态效果、自动字幕与降噪。

Magic Patterns Agent 2.0:基于现有样式生成原型。

Kollab:AI原生协作平台,将代理无缝集成至Slack或Telegram。

Reloop Animation Studio:支持皮克斯、3D黏土等风格的AI动画视频工具。

Monid:专为智能代理设计的钱包。

ASI:One:新一代个人AI助手。

Twenty 2.0:推出强大可扩展平台。

Devaito:整合建站、电商、APP、SEO、社媒、客服与销售自动化。

RankAI:首个真正有效的SEO/GEO代理。

Dageno AI:基于自采数据在多个LLM中追踪品牌曝光。

Nova Recruiter:智能招聘平台,从全球8亿+资料中筛选候选人。

SpeakON:iPhone磁吸式AI输入设备。

InstantDB:全功能开源应用构建工具。

Zernio Ads API:整合六大平台广告接口。

Ultimate Vocal Remover GUI:AI驱动人声移除图形界面应用。

Async Flash v1.0:实时语音模型,句子准确性81.2%,单元准确性88.6%。

Deezer:报告每日上传歌曲中44%为AI生成,计划授权检测技术。

YouTube:推出"形象检测"技术,识别AI生成的虚假名人内容。

谷歌地图:新增"地图影像实景融合"与"航空与卫星洞察"功能。

微软OneDrive:2026年规划增强Copilot功能,新增语义搜索与"Ask Copilot"按钮。

百度Create大会:将于5月13日首次设立超级个体主论坛。

全国青少年"李白"主题AIGC数字人应用大赛:启动,设45万元奖金。

灵光App:推出分一亿激励计划,每日最高投入100万元激励1万个优质闪应用,每周最高投入100万元激励100名优秀创作者。


七、投资

Anthropic:二级市场估值达1万亿美元,首次超越OpenAI的8800亿美元。

OpenAI:拟向DeployCo注入5亿美元股权,合资企业估值达100亿美元。

Cursor:估值从293亿美元飙升至500亿美元。

它石智航:获4.55亿美元Pre-A轮融资,高瓴、红杉联合领投,刷新中国具身智能领域融资纪录。

Vast Data:获10亿美元融资,估值升至300亿美元,英伟达参投。

马斯克/SpaceX:拟以600亿美元收购Cursor;以1.25万亿美元并购xAI;筹备6月IPO目标估值1.5万亿美元。

级数AI:完成数千万元天使轮融资,中广创投领投。

10x Science:完成480万美元种子轮融资,Initialized Capital领投。

NeoCognition:完成4000万美元种子轮融资。

奕行智能:完成15亿元B轮融资。

Eclipse创始人Lior Susan:筹资13亿美元,用于物理AI领域投资。

贝索斯旗下普罗米修斯AI实验室:推进100亿美元融资,估值达380亿美元。

软银:计划以所持OpenAI股份作担保,获取100亿美元贷款。

Sierra:收购Fragment(曾获种子轮200万美元融资)。

曦望:国内首家纯推理GPU独角兽,估值超百亿元,成立一年多完成七轮融资累计40亿元。

黑湖科技:估值70亿元。


八、行业观点与社会影响

黄仁勋:指出SaaS时代终结,Agentic as a Service将取而代之。

山姆·阿尔特曼与格雷格·布罗克曼:讲述与埃隆·马斯克分道扬镳原因,核心在于控制权归属问题,强调不会允许单一个人拥有对未来的绝对控制权。

库克卸任苹果CEO:约翰·特努斯接任,硬件老兵上位。

Meta裁员:计划全球裁员10%约8000人,全力押注AI。

谷歌内部代码75%由AI生成:皮查伊称生产力突破标志着核心战略,开发人员转型为代码评审员。

中美AI差距缩小至两年:斯坦福大学2026指数报告,中国在应用落地领域领先,美国在原创科研创新方面占主导。

Anthropic估值超越OpenAI:反映投资者对Anthropic未来增长潜力和商业化的乐观预期。

Z世代对AI态度转向审慎:48%在职者认为风险高于便利,伦理防范成关注焦点。

AI绘图模型成本深度评测:Reddit大佬发布22款生图模型测评,GPT二代价格比一代便宜七倍。

GPT-image-2信任危机:当造假成本趋近于零,验证真假成本趋近于无穷大,互联网信息生态底层信任机制受冲击。

Meta强制采集员工数据引发争议:员工强烈反对,担忧沦为"精确到秒"的监控对象。

佛罗里达州对OpenAI启动刑事调查:就佛罗里达州立大学枪击案关联问题。

杭州中院审理首例AI智能体流量劫持不正当竞争案:原告索赔1亿元。

多家美国保险公司收紧企业责任险中的AI理赔条款:超八成"AI免责"申请获批准。

美参议员伊丽莎白·沃伦:警告AI行业泡沫恐引发金融危机。

量化投资先驱Martin Lueck:警告勿将投资决策权交给AI。

印度22岁医学生:用AI创建虚拟网红"艾米丽·哈特",四个月吸粉超百万人。

爱奇艺AI艺人库争议:引发演员群体与粉丝强烈反对,AI短剧产业链遭质疑。

抖音AIGC创作规范:明确未经授权不得使用他人肖像、声音、作品进行AIGC创作。

报告:2026年出现智能爆炸概率达1%至10%。

Kimi被曝泄露用户隐私:误将他人简历发给用户,月之暗面回应为AI幻觉。

特朗普:表示Anthropic与美国国防部的AI合作"有望达成"使用协议。

Clarifai:删除从OkCupid获取的约300万张用户照片及其训练模型。

** unauthorized团体获得Anthropic网络安全工具Mythos访问权限**。

上海发布行动方案:推动产业互联网平台赋能产业发展(2026—2028年)。

北京大模型备案量:达225款,占全国总量约三成。

工信部:"十五五"期间将加强关键核心技术领域的标准制定;发布《智能网联汽车组合驾驶辅助系统安全要求》国标报批稿。

行业观察:Vibe Coding模式消耗token是传统协作模式的3倍,56%产出代码被淘汰;"70%问题"——AI代码看似70%正确,但完成剩余30%的代价往往超过从头手写。

AI重塑一人公司模式:百度设立超级个体论坛,多个非程序员背景者通过AI工具实现独立开发。

腾讯研究院:提出AI智能体驱动流量2.0时代,意图取代注意力成新范式;发布《丰饶之后:AI Coding观察报告2.0》。

METR研究:AI能力翻倍时间从7个月加速至3到4个月,今年发生智能爆炸的概率估计为1%到10%。

斯坦福2026指数报告:中美AI技术差距目前仅剩两年。

Forbes AI 50榜单:OpenAI与Anthropic累计融资2426亿美元,占上榜企业总融资额约80%。

Dario Amodei预测:3-6个月内AI写90%代码(未达成)。

Jellyfish调研:仅22.5%企业有正式AI政策。

软件开发岗位:仅为2020年1月的65%,初级岗位从30%降至20%,高级岗位从30%升至40%。

YC W2025批次:25%创业公司95%以上代码由AI生成,Solo founder比例从23.7%升至36.3%。

Staff+工程师:63.5%是最重度Agent用户。

Epic Games:超过50%的Claude Code使用来自非开发者。

Block:非工程师员工自己构建MCP服务器。

Replit CEO Amjad Masad:"往下走/留在中间/往上走"三象限。

Karpathy:Software 1.0→2.0→3.0(code→weights→prompts)。

Addy Osmani(Google Chrome工程师):提出"70%问题"。

祁晓亮(斯坦福):论述AI革命,从科研工具到科学合作者。

Steve Yegge:追踪调查Google内部AI普及情况,DeepMind偏好Claude而其他部门受限。


九、学习与研究资源

斯坦福:发布90分钟免费讲座,涵盖智能体系统构建全流程(提示工程、链式调用、RAG、多智能体系统)。

2026年版完整AI技术栈地图:发布,涵盖模型部署与安全趋势。

微软:开源智能体入门教程,12章教程,⭐59k+。

Hugging Face:推出ml-intern,自动阅读论文并编写代码,⭐3k。

AgentCraft:AI智能体开发课程,强调工具使用与记忆管理,299美元,8小时+。

数据工程教程:介绍使用Gherkin定义需求方法。

KNN算法可视化:动画解析距离度量与决策边界。

TensorTonic:免费机器学习数学博客系列,60+篇,含交互模拟。

逻辑回归可视化:从Sigmoid函数到梯度下降决策边界全流程演示。

Java开发者转型AI路径:RAG与Agent成关键方向。

简历匹配管道优化:单编码器多任务微调模型体积缩减至25MB。

视频审核中台架构优化:Java统筹AI预处理与零拷贝传输实践。

1Password:分享使用AI智能体重构单体架构经验。

Reddit/HackerNews社区讨论:大量技术问题与经验分享。

ICLR 2026:在里约热内卢召开,收到有效投稿超1.9万篇,录取率约28%。

ACL 2026:注册阶段出现论文标题与OpenReview不一致问题。

CVPR 2026:奖学金决策邮件未收到用户求助。

腾讯研究院:发起AI向善征集行动,聚焦"让人放心把人放大"。

全国青少年"李白"主题AIGC数字人应用大赛:启动,设45万元奖金。

InfoQ直播:实测ArkClaw与BoClaw自动化工作流搭建。

ELLIS:宣布25家研究单元成功通过延期评审。


十、总结与洞察

核心趋势

  1. Agent原生成为主流

    :从工具到Agent的范式转移加速,OpenAI Workspace Agents、Claude Managed Agents记忆、Codex五大升级标志着Agent时代全面到来。

  2. 模型能力快速收敛

    :六大商业模型在编码基准上压缩至1个百分点区间,但前沿实验室内部能力(如Anthropic Mythos Preview 93.9%)与公开模型差距拉大。

  3. 端侧AI爆发

    :商汤Sage(32B/3B)、小米MiMo-V2.5系列、华为鸿蒙座舱等推动AI从云端向端侧迁移。

  4. 具身智能加速

    :索尼Ace登Nature、特斯拉Optimus量产、它石智航4.55亿美元融资、智平方AlphaBrain开源,物理AI从实验室走向产业。

  5. AI Coding成熟

    :Cursor 500亿美元估值、Claude Code 25亿美元收入、YC 25%创业公司95%代码AI生成,"丰饶之后"验证期到来。

  6. 国产算力崛起

    :DeepSeek V4、美团万亿模型、曦望启望S3、华为昇腾等展示国产AI全栈能力。

  7. 信任与安全危机

    :GPT-image-2引发造假信任危机、Meta员工监控争议、AI安全数据集开源、ClawLess数学级安全防护,AI治理紧迫性凸显。

  8. 商业模式重构

    :从席位制转向消耗制,Agentic as a Service取代SaaS,按结果付费成为新趋势。

Logo

作为“人工智能6S店”的官方数字引擎,为AI开发者与企业提供一个覆盖软硬件全栈、一站式门户。

更多推荐