v0.6.0

V6:本地 AI、圖片生成和 OCR

本地 AI。圖像生成。OCR。圖表編輯。以及 VS Code 風格的界面。V6 已發布。

Vysakh Sreenivasan

看 Diwadi V6 的實際運作

六週前,我們推出了 V1。現在我們已經來到 V6——這個版本將 Diwadi 提升到全新的層次。使用本地 LLMs 完全離線運行 AI、透過 Stable Diffusion 生成圖像、從圖片中提取文字,以及編輯圖表——所有操作都無需離開應用程式。

V6 有什麼新功能

本地 LLM 支援

使用 llama.cpp 在完全離線的環境下執行 AI 模型。提供完整的工具調用支持,讓 AI 能夠與您的檔案互動。空閒時自動清理以節省資源。您的資料永遠不會離開您的機器—真正的隱私優先 AI。

AI 圖像生成

使用 Stable Diffusion 從文字提示生成圖片。從可用模型中選擇、自訂設定,並即時創建圖片。自動流程管理在幕後處理所有事務。

OCR 和圖表編輯

使用內建 OCR 從任何圖片中擷取文字。透過即時渲染編輯 D2 圖表。即時預覽 Mermaid 圖表。將 Typst 文件匯出為 PDF。支援 Intel Macs。

VS Code 風格標題欄

靈感來自 VS Code 的全新標題列設計。改進的分割視窗,讓多工處理更順暢。新的通知系統更不干擾工作。應用程式比以往更加專業。

更多功能

7-Zip 壓縮支援。Apple Sign-In 無縫身份驗證。字幕搜尋和取代。改進的 PPTX 和 DOCX 處理。整個應用程式的統一拖放功能。

Windows 就緒的建置

V6 帶來改進的 Windows 支援與即用版本。跨平台相容性比以往更好——在 macOS、Windows 和 Linux 上都能享受同樣出色的體驗。

技術細節

完整的 llama.cpp 整合與工具呼叫功能。具備自動模型管理的 Stable Diffusion 管線。由高效本地處理驅動的 OCR。D2 與 Mermaid 圖表渲染。Typst 轉 PDF 匯出。跨所有視圖的統一 drag-drop 系統。

數字亮點

自 V5 以來 120+ commits。20+ 個蟲修復。三個 AI engines(雲端、本機 LLM、影像生成)。同時保持應用程式輕量且快速。

120+
Commits
6
版本發布
3
AI 引擎
20+
錯誤修復

六週的出貨

V1 在 10 月 31 日。V2 在 11 月 7 日。V3 在 11 月 14 日。V4 在 11 月 21 日。V5 在 11 月 28 日。V6 今天。我們正以開放方式開發並每週發布新版本。這就是構建人們真正想要的軟體的方式。

查看完整更新日誌 →

六個版本。六週時間。本地 AI。圖像生成。立即下載 V6,體驗桌面生產力的未來。

下載 Diwadi V6

完整更新日誌

主要功能

  • Local LLM support with llama.cpp—run AI models completely offline
  • Full tool calling support for local LLMs
  • Auto cleanup when LLM is idle to save resources
  • AI image generation with Stable Diffusion integration
  • Multiple model support for image generation
  • OCR text extraction from images
  • D2 diagram rendering and editing
  • Mermaid diagram live preview
  • Typst preview and PDF export
  • 7-Zip compression support
  • Apple Sign-In authentication

技術改進

  • llama.cpp integration with proper process management
  • Stable Diffusion pipeline with automatic model downloads
  • OCR with auto compression for better performance
  • Intel Mac support for OCR features
  • Windows-ready builds with improved compatibility
  • Unified drag-drop system across all views
  • Improved PPTX and DOCX handling

UI/UX 增強

  • VS Code-style title bar design
  • Revamped split views for better multitasking
  • New notification system
  • Subtitle search and replace functionality
  • Improved drag-and-drop feedback
  • Better loading states throughout the app