deepseek-ocr这个名字过于低调,不去深入了解的以为又是一个orc模型而已,然而这个模型实现了十倍的信息压缩率,一个图像token可以顶十个文本token,这可是一件大事,在hn上直接炸了。deepseek还提出用图像模糊程度来模拟人类记忆随时间衰退的现象,读取同一张图片时可以调用不同分辨率的专家模型。

互联网充电站
 
 
Back to Top