文章详情

专注互联网科技,赋能企业数字化发展

Deepseek这么恐怖的吗

作者:Deepseek这么恐怖的吗

一个附件 100 MB,如果是纯文本(.md 本质是纯文本),按 UTF-8 编码且以中文为主估算,大约能容纳 3300 万汉字左右。 五十个附件的总容量为 5 GB,总字数大约在 16.5 亿字左右。 计算依据 · 1 MB = 1024 KB,100 MB ≈ 1.05 亿字节 · 中文在 UTF-8 中通常占 3 字节,英文和 Markdown 符号占 1 字节 · 按“中英文混合”保守折合为 平均 2.5 字节/字,100 MB 约可存 4000 万字; · 若按“纯中文”3 字节/字估算,则为 3300 万字 · 两种方式下,五十个附件总量均在 16.5 亿~20 亿字区间 这相当于把几十万本《红楼梦》(约 73 万字/本)的文字量装进这组附件里。 #Deepseek #ai #AI工具

返回新闻列表