編輯點評:將語言模型直接引入手機的應(yīng)用程序。
PocketPal AI本地大模型是一個手機上直接運行的本地AI對話工具,這個軟件可以讓你無需連接網(wǎng)絡(luò)久等與其他的AI大模型進行聊天和交流,本地部署方法需要根據(jù)流程進行摸索,可以在本地增加一個最近十分熱門的deepseek,這樣就不會卡頓的進行使用了。
部署方法
1.百度找到精品下載
2.在精品網(wǎng)中搜索PocketPal,點擊下載
3.打開軟件點擊Models,點+,點Hugging Face搜索大模型
4.盡量下載名字帶Q4_NL(4bit量化 normal 壓縮)的模型,回答比較精準(zhǔn)。
5.解釋一下部分量化標(biāo)識命名規(guī)則:NL 平衡精度與速度(Normal)、M 中等優(yōu)化(middle)、 XS 極致壓縮(Extra Small)、K 極限壓縮(K-special)、Qx 量化位數(shù)(手機上運行 Q4 最佳)。
6.在加載好模型后在Settings中把N PREDICT設(shè)置為4096。
如果遇到問題請發(fā)到評論區(qū),我會試著解決。
PocketPal AI是什么軟件
PocketPal AI 是一款袖珍型 AI 助手,由直接在手機上運行的小型語言模型 (SLM) 提供支持。PocketPal AI 專為 iOS 和 Android 設(shè)計,讓您無需互聯(lián)網(wǎng)連接即可與各種 SLM 進行交互。
軟件特色
離線 AI 協(xié)助:直接在您的設(shè)備上運行語言模型,無需互聯(lián)網(wǎng)連接。
模型靈活性:下載并在多個 SLM 之間進行交換,包括 Danube 2 和 3、Phi、Gemma 2 和 Qwen。
Auto Offload/Load:當(dāng)應(yīng)用程序在后臺運行時,通過卸載模型來自動管理內(nèi)存。
推理設(shè)置:自定義模型參數(shù),如系統(tǒng)提示符、溫度、BOS 令牌和聊天模板。
實時性能指標(biāo):在 AI 響應(yīng)生成期間查看每秒令牌數(shù)和每個令牌的毫秒數(shù)。
使用流程
下載模型
點擊漢堡菜單
導(dǎo)航到 “Models” 頁面
選擇您想要的型號并點擊下載
加載模型
下載后,點擊 Load 將模型導(dǎo)入內(nèi)存。現(xiàn)在您可以聊天了!
技巧
在 iOS 設(shè)備上,Apple 的 GPU API (Metal) 默認(rèn)處于激活狀態(tài)。如果您遇到任何問題,請嘗試停用它。
iOS 金屬
自動卸載/加載
為了保持設(shè)備平穩(wěn)運行,PocketPal AI 可以自動管理內(nèi)存使用情況:
在模型頁面上啟用 “Auto Offload/Load” (默認(rèn)情況下是)
該應(yīng)用程序?qū)⒃诤笈_卸載模型
當(dāng)您返回時,它會重新加載(對于較大的模型,請等待幾秒鐘)
高級設(shè)置
單擊 V 形圖標(biāo)可訪問高級 LLM 設(shè)置,例如:
溫度
BOS 代幣
聊天模板選項
等。
最后,讓我們聊聊吧!
加載模型后,前往 “聊天” 頁面并開始與加載的模型交談!
此時還會顯示 generation performance (生成性能) 指標(biāo)。如果有興趣,請觀察聊天氣泡以獲取實時性能指標(biāo):每秒令牌數(shù)和每個令牌的毫秒數(shù)。
重要提示:截至目前,我還沒有找到一種簡單的方法來從生成的響應(yīng)中選擇和復(fù)制文本,同時保留文本格式,尤其是 Markdown 支持。
同時,以下是當(dāng)前用于復(fù)制文本的選項:
段落級復(fù)制:長按特定段落可復(fù)制其內(nèi)容。
完整響應(yīng)復(fù)制:使用文本氣泡底部的復(fù)制圖標(biāo)復(fù)制 AI 生成的整個響應(yīng)。
我知道這些選項可能并不理想,這是我使用其他應(yīng)用程序的挫敗感之一。復(fù)制部分文本的困難曾經(jīng)是 ChatGPT 等聊天應(yīng)用程序特別煩人的方面。
開發(fā)商: PocketPal AI 是使用 React Native 構(gòu)建的。找到一種平衡文本選擇和保留格式(尤其是 Markdown 支持)的簡單解決方案對我來說一直很棘手。如果您有這方面的經(jīng)驗,我很樂意聽取您的意見!
更新日志
1.8.5
修復(fù):改進 Android 版本跨 Edge 到 Edge Display 的實現(xiàn)
v1.6.9
修復(fù):在 ChatGenerationSettingsSheet 中使用 processedSettings
1.6.7
修復(fù)(Android):刪除 llama.rn 的 FP16 編譯器標(biāo)志以解決 Deepseek
熱門評論
最新評論