v0.6.0

V6: IA local, generación de imágenes y OCR

IA local. Generación de imágenes. OCR. Edición de diagramas. E interfaz al estilo VS Code. V6 está aquí.

2025-12-05 • Vysakh Sreenivasan

Ver Diwadi V6 en acción

Hace seis semanas lanzamos V1. Ahora estamos en V6—y esta versión lleva a Diwadi a un nivel completamente nuevo. Ejecuta AI completamente sin conexión con LLMs locales, genera imágenes con Stable Diffusion, extrae texto de imágenes y edita diagramas—todo sin salir de la aplicación.

Novedades en V6

Soporte de LLM local

Ejecuta modelos de IA completamente sin conexión usando llama.cpp. Soporte completo de llamadas de herramientas para que la IA interactúe con tus archivos. Limpieza automática cuando está inactivo para ahorrar recursos. Tus datos nunca salen de tu máquina—IA realmente orientada a la privacidad.

Generación de Imágenes con IA

Genera imágenes a partir de descripciones de texto usando Stable Diffusion. Elige entre los modelos disponibles, personaliza la configuración y crea imágenes al instante. La gestión automática de procesos se encarga de todo en segundo plano.

OCR y edición de diagramas

Extrae texto de cualquier imagen con OCR integrado. Edita diagramas D2 con renderización en vivo. Obtén vista previa de diagramas Mermaid en tiempo real. Exporta documentos Typst a PDF. Compatible con Macs Intel incluido.

Barra de título estilo VS Code

Una barra de título completamente rediseñada inspirada en VS Code. Vistas divididas renovadas para una mejor multitarea. Nuevo sistema de notificaciones menos intrusivo. La aplicación se siente más profesional que nunca.

Aún más funciones

Compatibilidad con compresión 7-Zip. Apple Sign-In para autenticación sin problemas. Búsqueda y reemplazo de subtítulos. Manejo mejorado de PPTX y DOCX. Arrastrar y soltar unificado en toda la aplicación.

Compilaciones listas para Windows

V6 trae un soporte mejorado para Windows con versiones listas para usar. La compatibilidad multiplataforma es mejor que nunca: la misma experiencia excepcional en macOS, Windows y Linux.

Los detalles técnicos

Integración completa de llama.cpp con llamadas de herramientas. Pipeline de Stable Diffusion con gestión automática de modelos. OCR impulsado por procesamiento local eficiente. Renderizado de diagramas D2 y Mermaid. Exportación de Typst a PDF. Sistema unificado de drag-drop en todas las vistas.

Los Números

120+ commits desde V5. 20+ correcciones de errores. Tres motores de IA (nube, LLM local, generación de imágenes). Todo mientras mantenemos la aplicación ligera y rápida.

120+

Commits

Versiones

Motores de IA

20+

Corrección de errores

Seis semanas de lanzamientos

V1 el 31 de octubre. V2 el 7 de noviembre. V3 el 14 de noviembre. V4 el 21 de noviembre. V5 el 28 de noviembre. V6 hoy. Estamos construyendo en público y lanzamos algo nuevo cada semana. Así es como se construye software que la gente realmente quiere.

Ver registro de cambios completo →

Seis lanzamientos. Seis semanas. IA local. Generación de imágenes. Descarga V6 ahora y experimenta el futuro de la productividad en escritorio.

Descargar Diwadi V6

Registro de cambios completo

Características principales

Local LLM support with llama.cpp—run AI models completely offline
Full tool calling support for local LLMs
Auto cleanup when LLM is idle to save resources
AI image generation with Stable Diffusion integration
Multiple model support for image generation
OCR text extraction from images
D2 diagram rendering and editing
Mermaid diagram live preview
Typst preview and PDF export
7-Zip compression support
Apple Sign-In authentication

Mejoras técnicas

llama.cpp integration with proper process management
Stable Diffusion pipeline with automatic model downloads
OCR with auto compression for better performance
Intel Mac support for OCR features
Windows-ready builds with improved compatibility
Unified drag-drop system across all views
Improved PPTX and DOCX handling

Mejoras de UI/UX

VS Code-style title bar design
Revamped split views for better multitasking
New notification system
Subtitle search and replace functionality
Improved drag-and-drop feedback
Better loading states throughout the app