登录社区云,与社区用户共同成长
邀请您加入社区
暂无图片
为遵守国家网络实名制规定,未绑定将限制内容发布与互动
本文介绍了在昇腾双机8卡服务器上部署DeepSeek-V4-Flash-W8A8。
IE11停用后的兼容解决方案对比 随着IE11被强制禁用,银行网银、政府系统等老平台面临兼容问题。目前主流解决方案有两种: Edge IE模式:微软官方方案,安全性高但配置复杂,需手动添加白名单且每30天需续期,适合企业统一部署。 双核浏览器(如小智):集成Chromium和IE内核,一键切换无需配置,支持IE9/10/11版本选择,适合个人用户高频切换场景。 小智浏览器核心功能: 地址栏一键切换
在大模型推理服务的性能调优过程中,精准定位计算瓶颈、分析算子执行效率与资源利用率是提升系统吞吐与响应速度的关键。vLLM-Ascend作为基于昇腾NPU的高性能推理框架,集成了Ascend PyTorch Profiler能力,支持从框架层到硬件层的全栈性能数据采集。本文以Qwen3-32B模型为例,详细介绍如何在v0.14.0rc1版本中配置并采集在线服务的profiling数据,涵盖环境准备、
在传统管理模式效率低下、出错率⾼、追溯困难等痛点⽇益突出的今天,RFID固定资料管理系统正成为企业、政务、医疗等机构实现资产智能化管控的关键⼯具。睿丰德在RFID⼯业级应⽤领域拥有多年技术积累,其固定资产管理系统已完成与国内主流操作系统(麒麟、鸿蒙)及硬件平台(展讯、瑞芯微)的适配,在政务、物流、制造等场景有成熟落地案例,⾮实验室产品。针对常规资产与特殊品(涉密、⾼值、危险品)分别建库管理,可设置
在这个规模下,单卡推理4090的性能与A100几乎持平(模型能完整放在一张卡里,不涉及多卡通信),但价格只有A100的十分之一。397B总参数量的旗舰模型,实际激活只有17B参数,显存需求只有34GB。以RTX 4090的24GB显存为例:7B模型(FP16)稳跑,13B模型(FP16)基本能跑但长序列有压力,30B及以上不量化基本跑不了。Qwen3.6-27B是270亿参数的稠密多模态模型,支持
本篇学习鸿蒙权限体系,实现优雅的权限申请流程
华为昇腾PTO指令集针对亚二次注意力架构中的不规则Gather操作提出系统性优化方案。通过异构流水线设计实现计算与访存解耦重叠,采用L1/L0双缓冲和BlockSwizzle技术优化内存访问,并增强向量化指令支持。这些方法有效缓解了不规则访问导致的高延迟、低带宽和缓存抖动问题,体现了AI硬件从单纯追求算力向计算-访存协同优化的转变趋势。
亚二次注意力架构(SSA)正推动AI硬件指令集向稀疏计算转型。2026年,主流厂商通过增量式扩展而非革命性标准来应对SSA的动态稀疏计算需求:NVIDIA增强TensorCore支持灵活稀疏模式,华为昇腾优化通信计算融合,新兴企业则开发专用加速器指令。标准化进程呈现"分层演进"特征,在编译器抽象层(如MLIR)和行业基准(如MLPerf)形成软标准,而底层硬件指令保持差异化竞争
具身智能已成为人工智能产业极具发展潜力的前沿赛道,行业呈现高端人形机器人竞速发展、轻量化嵌入式方案并行突破的双重发展格局。在头部企业竞相研发全尺寸人形机器人的行业背景下,依托ESP32微控制器、以软硬协同、开源共建为核心的轻量化技术路线快速崛起,为具身智能低成本、规模化落地提供全新解决方案。本文以小智AI与MimiClaw技术融合为研究核心,系统性剖析两大技术体系在语音情感交互、自主智能控制层面的
HarmonyOS 6.0新增病毒防护服务管理能力,为EDR应用提供系统级安全协同接口。该能力包含三大核心功能:应用注册与信息同步(需REGISTER_ANTIVIRUS权限)、防病毒软件查询(需MANAGE_ANTIVIRUS权限)以及系统防护服务启停控制(需MANAGE_PREINSTALLED_ANTIVIRUS权限)。通过标准化API,第三方安全应用可融入鸿蒙安全体系,实现多层次防护。