Lười nhìn màn hình? Đây là 3 cách mình bắt máy đọc bài hộ
Số 003 | Text-to-Speech | ~8 phút đọc · ~5 phút nghe
Mắt mỏi vì manhua, tôi bắt đầu tìm cách nghe bài viết thay vì đọc — đây là những gì thật sự có ích, kèm tool miễn phí để bạn tự làm ngay.
Thành thật mà nói: tuần này hơi phí
Mình có phỏng vấn online với một công ty tuần này. Cái phỏng vấn đó… vấp thật sự. Câu “hãy kể về kinh nghiệm làm việc của bạn” — nghe quen, nhưng khi ngồi thật sự trước camera thì không biết bắt đầu từ đâu. Gần 5 năm làm freelance, không có sếp để refer, không có team để kể chuyện, không có title cụ thể trên CV. Chỉ có đống project mình tự làm, tự bán, tự triển khai — mà khi kể thành câu chuyện tuyển dụng thì… kỳ kỳ. Thêm cái lag internet lúc căng thẳng nữa là xong. Nhiều khả năng trượt rồi.
Cũng nhận thêm thư từ chối từ một bên freelance content creator ở Hàn Quốc. Cái này thì rõ ràng hơn rồi — không cần chờ.
Thế là tối đó mình mở manhua ra đọc cho quên chuyện. Xuyên không. Hơn 200 chap. Không phải đọc lướt — ngồi thưởng thức thật sự, cày cỡ 10 tiếng. Đến cuối thì mỏi mắt thật sự. Không muốn nhìn màn hình thêm một giây nào nữa.
Và lúc đó mình tự hỏi: ước gì có cái gì đọc to bài viết cho mình nghe, thay vì phải nhìn màn hình thêm. Thế là bật dậy đi tìm. Đây là những gì mình thử — và những gì thật sự có ích.
3 câu chuyện thật từ những người quanh mình
Nhìn lại thì đây không phải nhu cầu riêng của mình. Xung quanh mình, tuần này thôi, có ba câu chuyện thật với cùng một nhu cầu.
Hay đi bộ sau bữa tối và muốn nghe bài viết hay trong lúc đó, thay vì phải ngồi nhìn màn hình thêm sau một ngày dài — và sau hơn 200 chap manhua.
“Làm sao để nghe bài báo đọc to ra? Tiktoker thì nhảm, mà đọc chữ trên báo thì mỏi mắt quá.”
Đi làm lại sau một năm nghỉ sinh em bé. Nhìn màn hình cả ngày ở văn phòng, về nhà không còn sức, nhưng vẫn muốn học thêm tài liệu mới để bắt kịp.
Cả ba đều muốn tiêu thụ nội dung bằng tai thay vì bằng mắt. Không phải nhu cầu công nghệ — chỉ là muốn nghe mà không cần nhìn màn hình thêm.
3 công cụ TTS — kết quả thật
TTS = Text to Speech — công cụ chuyển chữ thành lời đọc. Đây là thứ tự mình đã đi qua.
Chrome / Firefox / Edge: Cài extension Read Aloud (miễn phí, có trên cả ba) → nhấn icon trên thanh địa chỉ là nghe cả trang. Hoặc bôi đen đoạn văn → chuột phải → “Đọc to lựa chọn” nếu dùng Chrome.
Microsoft Edge có thêm tính năng tích hợp sẵn: Nhấn F9 hoặc vào menu ⋯ → “Đọc to”. Giọng tiếng Việt dùng Neural TTS của Microsoft — nghe tự nhiên hơn giọng Chrome mặc định đáng kể. Trên điện thoại: tải Edge → mở bài viết → nhấn biểu tượng 🔊 trên thanh địa chỉ.
→ Zero setup, dùng được ngay. Chất lượng ở mức tạm — đủ để thử xem mình có thích nghe bài viết không trước khi đầu tư tool tốt hơn.
Supertonic là công cụ TTS chạy hoàn toàn trên máy tính của bạn — không cần internet, không tốn tiền, có 10 giọng (5 nữ F1–F5, 5 nam M1–M5), tiếng Việt nghe tự nhiên hơn Chrome rất nhiều.
Mình nhờ Claude cài đặt và build thêm file noi.py — một wrapper
đơn giản để ai cũng dùng được: mở file, thay văn bản, chọn giọng, chạy → ra file MP3
trên Desktop và tự động phát luôn.
* Nội dung demo là đoạn đầu bài viết này, được tạo bằng Supertonic + noi.py trên MacBook.
▶ Hướng dẫn cài đặt Supertonic + noi.py trên MacBook (từng bước) Nhấn để mở · dành cho người chưa quen kỹ thuật
Không cần biết lập trình. Chỉ cần làm đúng theo thứ tự bên dưới — khoảng 10–15 phút là xong.
Mở Spotlight (nhấn ⌘ + Space), gõ Terminal, nhấn Enter.
Gõ lệnh trên và nhấn Enter. Nếu thấy Python 3.x.x → sang bước 2. Nếu báo lỗi “command not found” → tải Python tại python.org/downloads/macos (bản mới nhất), cài bình thường như mọi ứng dụng.
Trong Terminal, nhập lệnh sau và nhấn Enter:
Lệnh này sẽ tự tải và cài Supertonic. Có thể mất 1–3 phút, cứ để máy chạy. Khi thấy dòng “Successfully installed…” là xong.
Tải file noi.py từ link Google Drive bên dưới, rồi kéo thả vào Desktop (màn hình chính của MacBook).
Chuột phải vào file noi.py trên Desktop → Open With → TextEdit.
Bạn sẽ thấy 3 chỗ cần chỉnh:
① VAN_BAN — dán nội dung bạn muốn nghe vào đây (giữa 3 dấu ngoặc """...""").
② GIONG — chọn giọng: "F1" đến "F5" là giọng nữ, "M1" đến "M5" là giọng nam.
③ TOC_DO — tốc độ đọc: 1.0 bình thường · 1.3 hơi nhanh · 1.6 nhanh.
Lưu file sau khi chỉnh: nhấn ⌘ + S. Nếu TextEdit hỏi “Keep .py extension?” → nhấn Use .py.
Quay lại Terminal, nhập lệnh sau và nhấn Enter:
Máy sẽ xử lý khoảng 10–30 giây (tuỳ độ dài văn bản). Khi thấy dòng ✅ Xong!, file MP3 sẽ xuất hiện trên Desktop và tự động phát lên nghe.
Lần sau chỉ cần: mở noi.py → thay văn bản → lưu → chạy lệnh trên. Xong.
→ Miễn phí, chạy offline hoàn toàn, chất lượng giọng tốt nhất trong tầm miễn phí. Nếu bạn dùng MacBook, đây là lựa chọn mình giới thiệu trước tiên.
Đây là công cụ mình dùng thật sự để làm bản audio cho bài này và các bài trước. Giọng tiếng Việt của Google (Neural2) nghe gần như người thật — mình thấy rõ sự khác biệt so với bất kỳ TTS miễn phí nào khác.
Mình đã build sẵn một tool HTML để bạn dùng ngay: dán script vào → chọn giọng → nhấn tạo → tải MP3 về. Không cần cài gì, chỉ cần một API Key miễn phí từ Google (hướng dẫn bên dưới).
* Đoạn mở đầu bài viết này, tạo bằng Google Cloud TTS qua tool bên dưới.
▶ Cách lấy Google Cloud API Key miễn phí (5 phút) Cần 1 tài khoản Google · miễn phí đến 1 triệu ký tự/tháng
Google TTS miễn phí cho đến 1.000.000 ký tự Neural2 mỗi tháng — đủ để tạo hàng giờ audio. Chỉ cần lấy API Key một lần, dùng mãi.
Truy cập console.cloud.google.com và đăng nhập tài khoản Google của bạn.
Nhấn vào dropdown tên project ở thanh trên → New Project. Đặt tên bất kỳ (ví dụ: “mk-tts-tool”) → nhấn Create. Đợi 10–15 giây để tạo xong.
Vào menu bên trái → APIs & Services → Library. Tìm kiếm Cloud Text-to-Speech API. Nhấn vào kết quả → nhấn nút Enable.
Vào APIs & Services → Credentials → nhấn + Create Credentials → chọn API Key. Một cửa sổ nhỏ hiện ra với API Key vừa tạo.
Copy API Key vừa tạo. Mở MK. Google TTS Tool, dán vào ô Google Cloud API Key ở đầu trang. Dán script → nhấn tạo → xong.
⚠ Giữ API Key bí mật — không paste lên mạng xã hội hay gửi cho ai. Key bị lộ, người khác có thể dùng quota của bạn.
→ Chất lượng tốt nhất hiện có, hoạt động trên mọi thiết bị qua trình duyệt, miễn phí đến 1 triệu ký tự/tháng. Đây là thứ mình dùng để tạo audio cho bài này.
Công cụ chỉ là một nửa vấn đề
Sau khi thử hết các công cụ, mình nhận ra một điều mà không cái nào giải quyết được: nội dung viết để mắt đọc rất khác nội dung để tai nghe.
Khi đọc bằng mắt, bạn có thể lướt, đọc lại, nhảy đoạn. Khi nghe, bạn theo tuyến tính — và nếu văn bản dùng gạch đầu dòng, câu dài, số liệu dày đặc, nghe là khó theo dõi lắm.
Nghe máy đọc bài viết bình thường cũng giống nghe ai đó đọc to hướng dẫn sử dụng điều hòa — đúng từng chữ, nhưng vào tai không vào đầu.
Thế là mình thêm một bước nữa: dùng AI (Claude) để viết lại bài từ định dạng “mắt đọc” sang định dạng “tai nghe” trước khi đưa vào TTS. Giống như biên tập thành script podcast — câu chuyển tiếp tự nhiên, bỏ danh sách khô khan, giữ nguyên giọng của tác giả. Kết quả nghe dễ theo dõi hơn hẳn.
Prompt mình dùng để chuyển blog → script nghe
Đây là prompt mình đang dùng thật sự. Copy về, dán bài viết bất kỳ vào cuối, gửi cho Claude hoặc ChatGPT — ra script, dán vào Google TTS Tool là nghe được ngay.
▶ Prompt chuyển blog thành script podcast tiếng Việt Nhấn để mở · có nút Copy
Paste bài viết vào chỗ [Dán nội dung blog vào đây] ở cuối, gửi cho Claude hoặc ChatGPT.
Bạn là ai → dùng cái gì
Miễn phí hoàn toàn, chạy không cần mạng. Xem hướng dẫn cài ở trên.
Tải noi.py →Chạy trên trình duyệt, mọi thiết bị. Cần API Key (lấy miễn phí, 5 phút).
Mở tool →Chuyển bài viết → script qua Claude/ChatGPT, rồi đưa vào TTS. Nghe khác hẳn.
Extension Read Aloud (Chrome/Firefox/Edge) hoặc tính năng “Đọc to” tích hợp của Edge. Zero setup.
Cài Read Aloud →Nếu bạn thấy hữu ích, gửi bài này cho 1 người hay than “mỏi mắt đọc báo”. Chỉ cần nhắn: “Mở link này, dán bài vào, nhấn tạo — là có audio nghe đi bộ rồi.”
MK. ra mỗi tuần, miễn phí.
AI Marketing Ops cho SME Việt · build in public · kể thật, không PR.
Đăng ký để nhận bài mới thẳng vào hộp thư — không spam, không quảng cáo.
Mỗi tuần một bài · có thể huỷ bất cứ lúc nào