对于DeepSeek 你需要知说念的8件事
2025-02-06Key Points DeepSeek单周下载量高达约240万次,可能越过豆包在前一年春节时代通过告白投放达到的下载量; 引发好意思股大跌的是两个模子DeepSeek-V3和DeepSeek-R1,前者是类4o模子,后者是类o1模子; DeepSeek-V3检修资本独一Llama 3的1%,DeepSeek-R1推理资本独一OpenAI o1的3%; DeepSeek-V3的多量翻新齐与克服使用H800(而不是H100)所带来的内存和带宽不及关连; R1系列模子打消了RLHF的HF(东说念主类