v0.6.0

V6: Lokale KI, Bildgenerierung und Texterkennung

Lokale KI. Bildgenerierung. OCR. Diagrammbearbeitung. Und eine VS Code-ähnliche Benutzeroberfläche. V6 ist da.

2025-12-05 • Vysakh Sreenivasan

Sehen Sie Diwadi V6 in Aktion

Vor sechs Wochen haben wir V1 veröffentlicht. Jetzt sind wir bei V6—und dieses Release hebt Diwadi auf ein völlig neues Level. Führen Sie KI komplett offline mit lokalen LLMs aus, generieren Sie Bilder mit Stable Diffusion, extrahieren Sie Text aus Bildern und bearbeiten Sie Diagramme—alles ohne die App zu verlassen.

Was ist neu in V6

Unterstützung für lokale LLM

Führen Sie AI-Modelle vollständig offline mit llama.cpp aus. Vollständige Unterstützung für Tool-Aufrufe, damit die KI mit Ihren Dateien interagieren kann. Automatische Bereinigung bei Untätigkeit zur Ressourceneinsparung. Ihre Daten verlassen Ihren Rechner niemals – echte datenschutzorientierte KI.

KI-Bildgenerierung

Generieren Sie Bilder aus Textaufforderungen mit Stable Diffusion. Wählen Sie aus verfügbaren Modellen, passen Sie die Einstellungen an und erstellen Sie sofort Bilder. Die automatische Prozessverwaltung kümmert sich um alles im Hintergrund.

OCR und Diagrammbearbeitung

Text aus beliebigen Bildern mit integriertem OCR extrahieren. D2-Diagramme mit Live-Rendering bearbeiten. Mermaid-Diagramme in Echtzeit in der Vorschau anzeigen. Typst-Dokumente als PDF exportieren. Unterstützung für Intel Macs inklusive.

VS Code-ähnliche Titelleiste

Eine vollständig neu gestaltete Titelleiste inspiriert von VS Code. Verbesserte geteilte Ansichten für besseres Multitasking. Neues Benachrichtigungssystem, das weniger aufdringlich ist. Die App wirkt professioneller denn je.

Noch mehr Funktionen

7-Zip-Komprimierungsunterstützung. Apple Sign-In für nahtlose Authentifizierung. Untertitel suchen und ersetzen. Verbesserte PPTX- und DOCX-Verarbeitung. Einheitliches drag and drop in der gesamten App.

Windows-Ready Builds

V6 bringt verbesserte Windows-Unterstützung mit einsatzbereiten Builds. Die plattformübergreifende Kompatibilität ist besser denn je—das gleiche großartige Erlebnis auf macOS, Windows und Linux.

Die technischen Details

Vollständige llama.cpp-Integration mit Tool-Calling. Stable Diffusion-Pipeline mit automatischer Modellverwaltung. OCR angetrieben durch effiziente lokale Verarbeitung. D2- und Mermaid-Diagramm-Rendering. Typst zu PDF Export. Einheitliches Drag-Drop-System über alle Ansichten.

Die Zahlen

120+ Commits seit V5. 20+ Fehlerbehebungen. Drei KI-Engines (Cloud, lokales LLM, Bildgenerierung). Alles während die App leicht und schnell bleibt.

120+

Commits

Versionen

KI-Engines

20+

Fehlerbehebungen

Sechs Wochen Veröffentlichungen

V1 am 31. Oktober. V2 am 7. November. V3 am 14. November. V4 am 21. November. V5 am 28. November. V6 heute. Wir bauen öffentlich und veröffentlichen jede Woche. So baut man Software, die Menschen wirklich wollen.

Vollständiges Änderungsprotokoll anzeigen →

Sechs Versionen. Sechs Wochen. Lokale KI. Bildgenerierung. Laden Sie V6 jetzt herunter und erleben Sie die Zukunft der Desktop-Produktivität.

Diwadi V6 herunterladen

Vollständiges Änderungsprotokoll

Hauptfunktionen

Local LLM support with llama.cpp—run AI models completely offline
Full tool calling support for local LLMs
Auto cleanup when LLM is idle to save resources
AI image generation with Stable Diffusion integration
Multiple model support for image generation
OCR text extraction from images
D2 diagram rendering and editing
Mermaid diagram live preview
Typst preview and PDF export
7-Zip compression support
Apple Sign-In authentication

Technische Verbesserungen

llama.cpp integration with proper process management
Stable Diffusion pipeline with automatic model downloads
OCR with auto compression for better performance
Intel Mac support for OCR features
Windows-ready builds with improved compatibility
Unified drag-drop system across all views
Improved PPTX and DOCX handling

Verbesserungen der Benutzeroberfläche

VS Code-style title bar design
Revamped split views for better multitasking
New notification system
Subtitle search and replace functionality
Improved drag-and-drop feedback
Better loading states throughout the app