v0.5.0

V5: Data Intelligence, Voice và Karaoke

Trí tuệ dữ liệu. Tổng hợp giọng nói. Phụ đề Karaoke. Và một không gian làm việc giống VSCode. V5 đã ra mắt.

Vysakh Sreenivasan

Xem Diwadi V5 hoạt động

Năm tuần trước, chúng tôi đã phát hành V1. Bây giờ chúng tôi đã có V5—và mỗi bản phát hành đều lớn hơn bản trước. Bản này thì sao? Nó biến Diwadi từ một trình quản lý tệp với AI thành một thứ mạnh mẽ hơn nhiều: một nền tảng trí tuệ dữ liệu với khả năng điều khiển bằng giọng nói.

Có gì mới trong V5

Bộ Trí tuệ dữ liệu

Tạo bảng điều khiển tương tác từ các tệp CSV và Excel của bạn. Thêm các trường được tính toán bằng công thức tùy chỉnh. Xây dựng biểu đồ, trực quan hóa so sánh và các tiện ích có thể thay đổi kích thước. Lưu mọi thứ dưới dạng tệp sổ làm việc .dwb. Giống như có một mini Tableau được tích hợp ngay trong trình quản lý tệp của bạn.

Hệ thống giọng nói và âm thanh

Chuyển văn bản thành giọng nói hoạt động hoàn toàn ngoại tuyến. Tích hợp sẵn tính năng chuyển giọng nói thành văn bản. Không cần Internet, không cần khóa API. Dữ liệu giọng nói của bạn được lưu ngay trên máy.

Karaoke Subtitles

Tạo phụ đề theo thời gian từng chữ từ bất kỳ video nào. Chuyển đổi giọng nói tự động tạo thời gian chính xác ở cấp độ từ. Ghi phụ đề trực tiếp vào video. Hoàn hảo cho video ca nhạc, hướng dẫn hoặc nội dung mạng xã hội.

Không gian làm việc nhiều tab

Các ngăn chia kiểu VSCode. Mở nhiều tệp cạnh nhau. Quản lý tab với trạng thái được đồng bộ hóa. Làm việc theo cách của các nhà phát triển—nhưng dành cho tất cả các tệp của bạn.

Trình chỉnh sửa video nâng cao

Chỉnh sửa âm thanh với căn chỉnh từ tính. Lớp phủ văn bản với kiểm soát thời lượng. Kéo hình ảnh vào dòng thời gian. Lịch sử hoàn tác/làm lại đầy đủ. Lưu dự án dưới dạng tệp .vep với tất cả nội dung được đóng gói.

10 Ngôn Ngữ Hoàn Chỉnh

10.451 khóa dịch trên 10 ngôn ngữ. Các hook tiền-commit đảm bảo không có chuỗi mã hóa cứng nào lọt qua. Tính năng phát hiện khóa bị thiếu giúp bản dịch luôn đầy đủ.

Thông tin chi tiết về kỹ thuật

Tái cấu trúc hoàn chỉnh logic video/phụ đề/chú thích. Tổ chức lại điều hướng tiêu đề và tập tin. Cải tiến PDF parser. Tái cấu trúc bố cục và tabstore. Dọn dẹp code chết trong toàn bộ codebase.

Các số

156 bản commit kể từ V4. Hơn 30 bản sửa lỗi. Bộ công cụ tình báo dữ liệu hoàn chỉnh. Hệ thống giọng nói ngoại tuyến. Tất cả vẫn nằm gọn trong một bản tải xuống nhẹ.

156
Số lần commit
10K+
Khóa dịch thuật
10
Ngôn ngữ
30+
Sửa lỗi

Chu kỳ phát hành 5 tuần

V1 vào ngày 31/10. V2 vào ngày 7/11. V3 vào ngày 14/11. V4 vào ngày 21/11. V5 hôm nay. Chúng tôi xây dựng công khai và ra mắt phiên bản mới hàng tuần. Đây là cách để tạo ra phần mềm mà mọi người thực sự mong muốn.

Xem nhật ký thay đổi đầy đủ →

Năm tuần, năm bản phát hành. Tải ngay V5 và xem chúng tôi đã tiến xa đến đâu.

Tải xuống Diwadi V5

Nhật ký thay đổi đầy đủ

Tính năng chính

  • Data Intelligence Suite with dashboards, calculated fields, and visualizations
  • Widget system with resizable, formattable widgets and direct data binding
  • .dwb workbook format for saving and loading dashboard projects
  • Offline text-to-speech—no internet required
  • Speech-to-text transcription built in
  • Karaoke subtitle generation with word-level timing
  • Burn subtitles directly into videos
  • VSCode-style multi-tab workspace with split panes
  • Audio editor with magnetic alignment to video clips
  • Text overlays with duration control and design options
  • AI-powered Word document creation
  • Complete undo/redo history for video editing
  • .vep video project format with bundled assets

Cải tiến kỹ thuật

  • 10 complete language translations with 10,451 keys
  • Pre-commit hooks for hardcoded string detection
  • Intelligent git staging that re-stages only previously staged files
  • Bun-only testing framework enforcement
  • Optional native dependencies for headless CI builds
  • Video/subtitle/caption logic extraction and refactoring
  • Header and file navigation reorganization
  • PDF parser improvements
  • Layout and tabstore restructuring

Cải tiến UI/UX

  • Activity panel redesign with better cards
  • File browser search within browser panel
  • Theme-based logos on splash screen
  • File tree tooltips for full filenames
  • Improved video preview loading states
  • Better loader animations throughout the app
  • Current word highlighting during karaoke playback
  • Auto-scroll to generated captions