v0.6.0

V6: ローカルAI、画像生成、およびOCR

ローカルAI。画像生成。OCR。図表編集。VS Code スタイルのインターフェース。V6がここにあります。

Vysakh Sreenivasan

Diwadi V6の実際の動作を見る

6週間前にV1をリリースしました。そして今、V6に到達—このリリースでDiwadiは全く新しいレベルへと進化します。ローカルLLMで完全にオフラインでAIを実行し、Stable Diffusionで画像を生成し、画像からテキストを抽出し、ダイアグラムを編集—すべてアプリ内で完結します。

V6の新機能

ローカルLLMサポート

llama.cpp を使用して AI モデルを完全にオフラインで実行します。ツール呼び出しの完全なサポートにより、AI はあなたのファイルと対話できます。アイドル時の自動クリーンアップでリソースを節約します。あなたのデータはマシンを離れることはありません—真のプライバシーファーストな AI です。

AI画像生成

テキストプロンプトからStable Diffusionを使用して画像を生成します。利用可能なモデルから選択し、設定をカスタマイズして、瞬時に画像を作成します。自動プロセス管理がバックグラウンドですべてを処理します。

OCR と図表編集

組み込みOCRで任意の画像からテキストを抽出します。ライブレンダリング付きD2ダイアグラムを編集します。Mermaidダイアグラムをリアルタイムでプレビューします。TypstドキュメントをPDFにエクスポートします。Intel Macのサポートが含まれています。

VS Code風のタイトルバー

VS Codeにインスパイアされた完全に再設計されたタイトルバー。マルチタスキングを改善するために改良されたスプリットビュー。よりスマートな新しい通知システム。アプリはこれまで以上にプロフェッショナルに見えます。

さらに多くの機能

7-Zip圧縮サポート。シームレスな認証のためのApple Sign-In。字幕の検索と置換。改善されたPPTXおよびDOCX処理。アプリ全体にわたる統一されたドラッグアンドドロップ。

Windows-Ready Builds

V6は改善されたWindowsサポートと出荷準備完了のビルドをもたらします。クロスプラットフォーム互換性がかつてないほど向上しました—macOS、Windows、Linuxで同じ優れたエクスペリエンスを実現します。

技術詳細

Complete llama.cpp integration with tool calling. Stable Diffusion pipeline with automatic model management. OCR powered by efficient local processing. D2 and Mermaid diagram rendering. Typst to PDF export. Unified drag-drop system across all views.

数字

V5以来120以上のコミット。20以上のバグ修正。3つのAIエンジン(クラウド、ローカルLLM、画像生成)。すべてアプリを軽量で高速に保ちながら実現。

120+
コミット
6
リリース
3
AIエンジン
20+
バグ修正

6週間のシップ

V1は10月31日。V2は11月7日。V3は11月14日。V4は11月21日。V5は11月28日。V6は本日。私たちは公開で開発し、毎週リリースしています。これが人々が本当に求めるソフトウェアの作り方です。

完全な変更履歴を見る →

6つのリリース。6週間。ローカルAI。画像生成。今すぐV6をダウンロードして、デスクトップ生産性の未来を体験してください。

Diwadi V6 をダウンロード

完全な変更履歴

主要機能

  • Local LLM support with llama.cpp—run AI models completely offline
  • Full tool calling support for local LLMs
  • Auto cleanup when LLM is idle to save resources
  • AI image generation with Stable Diffusion integration
  • Multiple model support for image generation
  • OCR text extraction from images
  • D2 diagram rendering and editing
  • Mermaid diagram live preview
  • Typst preview and PDF export
  • 7-Zip compression support
  • Apple Sign-In authentication

技術的改善

  • llama.cpp integration with proper process management
  • Stable Diffusion pipeline with automatic model downloads
  • OCR with auto compression for better performance
  • Intel Mac support for OCR features
  • Windows-ready builds with improved compatibility
  • Unified drag-drop system across all views
  • Improved PPTX and DOCX handling

UI/UX改善

  • VS Code-style title bar design
  • Revamped split views for better multitasking
  • New notification system
  • Subtitle search and replace functionality
  • Improved drag-and-drop feedback
  • Better loading states throughout the app