v0.6.0

V6: AI Cục bộ, Tạo hình ảnh và OCR

AI cục bộ. Tạo hình ảnh. OCR. Chỉnh sửa sơ đồ. Và giao diện kiểu VS Code. V6 đã xuất hiện.

Vysakh Sreenivasan

Xem Diwadi V6 hoạt động

Sáu tuần trước, chúng tôi đã ra mắt V1. Giờ đây chúng tôi đã có V6—và phiên bản này đưa Diwadi lên một tầm cao hoàn toàn mới. Chạy AI hoàn toàn offline với LLMs cục bộ, tạo hình ảnh với Stable Diffusion, trích xuất văn bản từ hình ảnh, và chỉnh sửa sơ đồ—tất cả mà không cần rời khỏi ứng dụng.

Có gì mới trong V6

Hỗ trợ LLM cục bộ

Chạy các mô hình AI hoàn toàn ngoại tuyến bằng llama.cpp. Hỗ trợ gọi công cụ đầy đủ để AI có thể tương tác với các tệp của bạn. Tự động dọn dẹp khi không hoạt động để tiết kiệm tài nguyên. Dữ liệu của bạn không bao giờ rời khỏi máy—AI với tinh thần bảo mật trên hết.

Tạo hình ảnh bằng AI

Tạo hình ảnh từ văn bản mô tả bằng Stable Diffusion. Chọn từ các mô hình có sẵn, tùy chỉnh cài đặt và tạo hình ảnh ngay lập tức. Quản lý quy trình tự động xử lý mọi thứ ở chế độ nền.

OCR và Chỉnh sửa Sơ đồ

Trích xuất văn bản từ bất kỳ hình ảnh nào với OCR tích hợp. Chỉnh sửa sơ đồ D2 với kết xuất trực tiếp. Xem trước sơ đồ Mermaid theo thời gian thực. Xuất tài liệu Typst sang PDF. Hỗ trợ Intel Macs.

Thanh tiêu đề kiểu VS Code

Thanh tiêu đề được thiết kế lại hoàn toàn, lấy cảm hứng từ VS Code. Chế độ xem phân chia được cải tiến để đa nhiệm tốt hơn. Hệ thống thông báo mới ít làm phiền hơn. Ứng dụng mang cảm giác chuyên nghiệp hơn bao giờ hết.

Nhiều Tính Năng Hơn Nữa

Hỗ trợ nén 7-Zip. Xác thực liền mạch với Apple Sign-In. Tìm kiếm và thay thế phụ đề. Xử lý PPTX và DOCX được cải thiện. Kéo và thả thống nhất trên toàn bộ ứng dụng.

Bản dựng sẵn sàng cho Windows

V6 mang đến hỗ trợ Windows được cải thiện với các bản build sẵn sàng triển khai. Khả năng tương thích đa nền tảng tốt hơn bao giờ hết—trải nghiệm tuyệt vời như nhau trên macOS, Windows và Linux.

Chi tiết kỹ thuật

Tích hợp llama.cpp hoàn chỉnh với khả năng gọi công cụ. Pipeline Stable Diffusion với quản lý mô hình tự động. OCR được hỗ trợ bởi xử lý cục bộ hiệu quả. Kết xuất sơ đồ D2 và Mermaid. Xuất Typst sang PDF. Hệ thống drag-drop thống nhất trên tất cả các giao diện.

Những Con Số

120+ commit kể từ V5. 20+ lỗi được sửa chữa. Ba AI engines (đám mây, local LLM, tạo hình ảnh). Tất cả trong khi giữ ứng dụng nhẹ và nhanh.

120+
Commits
6
Các Bản Phát Hành
3
Công Cụ AI
20+
Sửa lỗi

Sáu Tuần Giao Hàng

V1 vào 31 tháng 10. V2 vào 7 tháng 11. V3 vào 14 tháng 11. V4 vào 21 tháng 11. V5 vào 28 tháng 11. V6 hôm nay. Chúng tôi đang xây dựng công khai và phát hành mỗi tuần. Đây là cách để xây dựng phần mềm mà mọi người thực sự muốn.

Xem nhật ký thay đổi đầy đủ →

Sáu phiên bản. Sáu tuần. AI cục bộ. Tạo hình ảnh. Tải V6 ngay và trải nghiệm tương lai của năng suất máy tính.

Tải xuống Diwadi V6

Nhật ký thay đổi đầy đủ

Tính năng chính

  • Local LLM support with llama.cpp—run AI models completely offline
  • Full tool calling support for local LLMs
  • Auto cleanup when LLM is idle to save resources
  • AI image generation with Stable Diffusion integration
  • Multiple model support for image generation
  • OCR text extraction from images
  • D2 diagram rendering and editing
  • Mermaid diagram live preview
  • Typst preview and PDF export
  • 7-Zip compression support
  • Apple Sign-In authentication

Cải tiến kỹ thuật

  • llama.cpp integration with proper process management
  • Stable Diffusion pipeline with automatic model downloads
  • OCR with auto compression for better performance
  • Intel Mac support for OCR features
  • Windows-ready builds with improved compatibility
  • Unified drag-drop system across all views
  • Improved PPTX and DOCX handling

Cải tiến UI/UX

  • VS Code-style title bar design
  • Revamped split views for better multitasking
  • New notification system
  • Subtitle search and replace functionality
  • Improved drag-and-drop feedback
  • Better loading states throughout the app