登录社区云,与社区用户共同成长
邀请您加入社区
暂无图片
为遵守国家网络实名制规定,未绑定将限制内容发布与互动
摘要:针对AI小智设备无法识别声源方向的痛点,提出采用AR1106声源定位模组的外接扩展方案。该方案通过独立双麦克风阵列和TDOA算法实现±10°精确定位,不占用主机算力,即插即用。AR1106独立完成指令触发、方向识别和舵机转向全流程,支持5米内180°范围定位,响应速度达毫秒级。方案保持AI小智原有功能不变,仅通过标准接口实现"指令识别+方向定位"协同,有效解决多人场景下的
AI硬件创业,看起来很酷,做起来全是坑。真正的壁垒不是技术,而是对用户的深度理解、对供应链的极致把控、对产品细节的死磕,以及对市场节奏的精准把握。从爆改火火兔到年销10万台,FOLOTOy走过了一条务实而坚韧的路。他们没有一开始就追求"颠覆性创新",而是从真实需求出发,快速试错、快速迭代、快速止损。在AI硬件这个赛道上,活下来比跑得快更重要。
Cerebras的晶圆级引擎(WSE)技术对英伟达构成多维挑战:技术上,WSE-3通过单芯片集成90万核心和44GB片上SRAM,在算力密度和内存带宽上实现突破,特别适合大模型训练;市场上,Cerebras聚焦高端科研和超大模型训练利基市场,提供软硬一体解决方案;生态上采取垂直整合策略,简化开发体验。虽然短期内难以撼动英伟达的CUDA生态主导地位,但Cerebras已证明颠覆性架构在特定领域的优势
OpenHarmony 跨平台 SIG 已形成全覆盖、多技术栈、低门槛Web 前端→ 优先 RN / Cordova / Ionic移动端原生→ 优先 KMP / Flutter桌面/嵌入式→ 优先 Electron / Qt基础能力补齐→ 直接用 ApplicationTPC 三方库所有框架均遵循开源规范,持续迭代更新,是现有应用一键上鸿蒙的最优路径。
大多数人都还没意识到这意味着什么……对创业者、供应链、整个世界都将产生深远影响。AI硬件不是将要发生,而是已经切实发生在我们身边了。• 你的供应链稳了吗?• 你的技术团队强了吗?• 你准备好迎接Physical AI时代了吗?Lenny’s Podcast - 《为什么我们正处于AI硬件热潮的开端》Caitlin Kalinowski(前OpenAI、Meta、Apple硬件负责人)2026年5月
想把 LLaMA 的上下文从 4K 拉到 32K,但一跑就 OOM?别急着换模型。FlashAttention 的分块机制配合 ops-transformer 的 chunked prefill,让你在昇腾NPU 上跑 32K 上下文成为可能。这篇文章手把手带你配置长上下文环境,30 分钟搞定。
你不是搞算子的,用 Python ACL 就够了。
摘要 本文深入分析了鸿蒙PC应用启动性能优化的关键策略。作者指出,与传统移动应用不同,鸿蒙PC启动的核心不是页面初始化,而是整个状态系统的恢复,包括Workspace、Focus、Task等多个运行时环境。文章揭示了常见误区,如将所有初始化操作集中在启动阶段,导致主线程阻塞。提出了八大优化方案:Workspace延迟恢复、Store分级初始化、AI Runtime后置、首页状态精简、启动快照构建、
刚接触昇腾NPU算子开发那会,我被一个问题砸懵了:为什么写个矩阵乘法要3000行代码?而且大部分代码是在调内存、调流水、调同步,真正算矩阵乘法的代码不到10%。直到我发现了(CANN Template Library for Ascend),才知道算子开发还能这么玩。
正在用昇腾NPU 跑大模型推理,被以下几个问题困扰?别急着加 GPU。换个 attention 算子就能解决。ops-transformer 仓库(https://atomgit.com/cann/ops-transformer)里的 FlashAttention 算子,把 PyTorch 原生 attention 换成它,延迟直接砍到 1/3,显存占用降到原来的 1/5。这篇文章手把手带你从零开