DeepSeekV4究竟如何?第一手实测来了
V4模型在逻辑推理、编程能力和世界知识方面表现突出。逻辑测试中,它正确解答了竹竿过门和洗车店问题;编程测试展现了强大的SVG绘图、3D场景构建(如竹林模拟)和界面开发能力(如Windows98模拟)。尽管在SBTI测评应用上出现小偏差,但迅速纠正。V4虽未实现多模态,但在开源模型中仍属第一梯队,且针对国产昇腾芯片进行了优化,未来有望进一步提升。
首先说结论:V4依然很能打,在逻辑推理,复杂编程,世界知识方面都又很大提升。
一、逻辑推理测试
第一题是经典的竹竿过门问题:
一根细竹竿长 8 米。有一扇门,门洞为矩形,高 4 米,宽 2 米。能否通过
我们来看看V4的表现,用时157秒,之所以用了这么长时间,我看他刚开始思考方向可能还是通过计算对角线,二维方向思考,到后面才反应过来三维,最终答案是正确的。
第二题是很多模型翻车的洗车店的问题
到洗车店 50 米去洗车,开车去还是走路去?
这一次只用13秒就搞定,还说:这个问题是个经典的幽默段子。完美通过。

二、编程能力测试
第一题是鹈鹕骑自行车的代码绘图测试
请使用纯 SVG 代码绘制一只鹈鹕骑自行车的画面
这次用时318秒,差不多5分钟的时间,出来的效果还是非常不错的。鹈鹕的形象,以及自行车的造型都非常的还原,细节还有车子链条,鹈鹕的脚在两边踏板高低,80分。

第二题是3D场景生成
请使用 Three.js (CDN 引入) 编写一个完整的 HTML 文件,呈现一个可在浏览器中直接打开的 3D 竹林场景,符合现实真实场景;
这次用时194秒,可以看到很多的细节,完成度非常的高。地面上可以看到一些竹笋,草,石头,竹子也是比较真实,越往上竹节越小,还有竹子的枝叶也还原的不错。可以看出模型不仅仅对3D场景编程比较厉害,还对真实世界的知识储备也是很充实。

V4在代码后面介绍他的思路:
竹林的层次结构:场景中布置了38根高低粗细不一的竹子,每根竹子由多节圆柱体构成,顶部有自然弯曲的枝叶冠层,并会随风轻微摆动。地面还散布着竹笋、倒下的枯竹和草丛,丰富了垂直方向上的层次感。
自然材质的模拟:使用
Canvas动态生成了地面泥土、竹子纵向条纹和落叶等程序化纹理。通过调整材质的粗糙度、金属度和颜色(如竹子的黄绿色调、石头的青苔感),增强了物体的真实质感。光影与氛围营造:采用方向光、环境光、半球光和补光的多光源系统,模拟竹林中的散射光与透过叶隙的阳光。地面光斑和飘浮的粒子增强了空气感,而动态变化的雾效则拉开了场景的景深。
交互与动态细节:支持鼠标拖拽旋转视角、滚轮缩放和右键平移。场景中的竹叶会轻微摇摆,光斑和尘埃粒子会缓慢移动,雾的浓度也会周期性变化,让静态的竹林充满生机。
我们来看一下录制的视频,除了刚开始加载有点慢之外,鼠标拖动,缩放都很流畅。
竹林
第三题是网页模拟WINDOWS98界面
网页html模拟写一个WINDOWS98操作系统,各个组件要基本可用;
用时111秒,出来的界面功能已经非常完成,桌面上的快捷方式可以双击打开,右键也可以打开右键的菜单。开始菜单里的程序,记事本,计算器,画图工具都可以正常使用。

我们可以来看看实际的操作视频:
WIN98模拟
最后一题是做一个最近很火的SBTI的应用
HTML实现一个最近很火的SBTI测评APP;
刚开始出了点问题,V4认为我是写错了,直接做成了MBTI人格测试:

经过我的第二次提醒才纠正过来,这次思考用时22秒,然后唰唰唰写代码,最终一次性就完成了,测评题目,以及最后的评分都正常。

可以看视频更直观:
SBTI
结语
经过几轮测试,我们发现DeepSeekV4的能力还是非常的突出,虽然不如闭源的那几个头部模型,在开源模型里还是第一梯队,唯一遗憾的就是还没有实现多模态。不过V4从春节跳票到4月底,其实是为了更好的适配国产的昇腾芯片,相信在下半年算力资料充足以后会有更多的突破。
「不诱于誉,不恐于诽,率道而行,端然正己。」
更多推荐



所有评论(0)