之前介绍了用full moon部署1.5b大deepseek r1,但是需要梯子。 今天介绍不需要梯子,部署1.5b和7b的方式。7B基本上是iphone16极限了,下一代iPhone 内存大小非常重要,16GB估计能跑13b好32b模型。可惜iPhone17估计现在已经设计完成,改不了,要iPhone18才是更适合端侧的iPhone。 首先取apple store下载pocketpal ai ,中国区store就有。 第二步是单独下载模型,咱们用不了hugging face就用hf-mirror.com下载模型。我这里用的是7b模型,(p3-p7)。 接着从本地添加模型,见p8-p10。 接着load模型,开始聊天。 iPhone16跑下来#大模型 #1s 7-8token,可用。不过app写的就不怎么样了,手机黑屏后要重新load模型。 第一次记得修改setting,把context从200改成4096token。要不然模型说几句话就把token用完了。(p12/p13)#iphone #大模型 #大模型部署 #deepseek