v0.6.0

V6: IA local, generación de imágenes y OCR

IA local. Generación de imágenes. OCR. Edición de diagramas. E interfaz al estilo VS Code. V6 está aquí.

Vysakh Sreenivasan

Ver Diwadi V6 en acción

Hace seis semanas lanzamos V1. Ahora estamos en V6—y esta versión lleva a Diwadi a un nivel completamente nuevo. Ejecuta AI completamente sin conexión con LLMs locales, genera imágenes con Stable Diffusion, extrae texto de imágenes y edita diagramas—todo sin salir de la aplicación.

Novedades en V6

Soporte de LLM local

Ejecuta modelos de IA completamente sin conexión usando llama.cpp. Soporte completo de llamadas de herramientas para que la IA interactúe con tus archivos. Limpieza automática cuando está inactivo para ahorrar recursos. Tus datos nunca salen de tu máquina—IA realmente orientada a la privacidad.

Generación de Imágenes con IA

Genera imágenes a partir de descripciones de texto usando Stable Diffusion. Elige entre los modelos disponibles, personaliza la configuración y crea imágenes al instante. La gestión automática de procesos se encarga de todo en segundo plano.

OCR y edición de diagramas

Extrae texto de cualquier imagen con OCR integrado. Edita diagramas D2 con renderización en vivo. Obtén vista previa de diagramas Mermaid en tiempo real. Exporta documentos Typst a PDF. Compatible con Macs Intel incluido.

Barra de título estilo VS Code

Una barra de título completamente rediseñada inspirada en VS Code. Vistas divididas renovadas para una mejor multitarea. Nuevo sistema de notificaciones menos intrusivo. La aplicación se siente más profesional que nunca.

Aún más funciones

Compatibilidad con compresión 7-Zip. Apple Sign-In para autenticación sin problemas. Búsqueda y reemplazo de subtítulos. Manejo mejorado de PPTX y DOCX. Arrastrar y soltar unificado en toda la aplicación.

Compilaciones listas para Windows

V6 trae un soporte mejorado para Windows con versiones listas para usar. La compatibilidad multiplataforma es mejor que nunca: la misma experiencia excepcional en macOS, Windows y Linux.

Los detalles técnicos

Integración completa de llama.cpp con llamadas de herramientas. Pipeline de Stable Diffusion con gestión automática de modelos. OCR impulsado por procesamiento local eficiente. Renderizado de diagramas D2 y Mermaid. Exportación de Typst a PDF. Sistema unificado de drag-drop en todas las vistas.

Los Números

120+ commits desde V5. 20+ correcciones de errores. Tres motores de IA (nube, LLM local, generación de imágenes). Todo mientras mantenemos la aplicación ligera y rápida.

120+
Commits
6
Versiones
3
Motores de IA
20+
Corrección de errores

Seis semanas de lanzamientos

V1 el 31 de octubre. V2 el 7 de noviembre. V3 el 14 de noviembre. V4 el 21 de noviembre. V5 el 28 de noviembre. V6 hoy. Estamos construyendo en público y lanzamos algo nuevo cada semana. Así es como se construye software que la gente realmente quiere.

Ver registro de cambios completo →

Seis lanzamientos. Seis semanas. IA local. Generación de imágenes. Descarga V6 ahora y experimenta el futuro de la productividad en escritorio.

Descargar Diwadi V6

Registro de cambios completo

Características principales

  • Local LLM support with llama.cpp—run AI models completely offline
  • Full tool calling support for local LLMs
  • Auto cleanup when LLM is idle to save resources
  • AI image generation with Stable Diffusion integration
  • Multiple model support for image generation
  • OCR text extraction from images
  • D2 diagram rendering and editing
  • Mermaid diagram live preview
  • Typst preview and PDF export
  • 7-Zip compression support
  • Apple Sign-In authentication

Mejoras técnicas

  • llama.cpp integration with proper process management
  • Stable Diffusion pipeline with automatic model downloads
  • OCR with auto compression for better performance
  • Intel Mac support for OCR features
  • Windows-ready builds with improved compatibility
  • Unified drag-drop system across all views
  • Improved PPTX and DOCX handling

Mejoras de UI/UX

  • VS Code-style title bar design
  • Revamped split views for better multitasking
  • New notification system
  • Subtitle search and replace functionality
  • Improved drag-and-drop feedback
  • Better loading states throughout the app