Lười nhìn màn hình? Đây là 3 cách mình bắt máy đọc bài hộ
Newsletter · AI Business & Marketing Ops

Lười nhìn màn hình? Đây là 3 cách mình bắt máy đọc bài hộ

Số 003 | Text-to-Speech | ~8 phút đọc · ~5 phút nghe

Mắt mỏi vì manhua, tôi bắt đầu tìm cách nghe bài viết thay vì đọc — đây là những gì thật sự có ích, kèm tool miễn phí để bạn tự làm ngay.


🎙
Nghe bài này
MK. Số 003 — Bản tóm tắt audio · ~5 phút
Giọng Nam
🎧 Đây là bản tóm tắt nhanh của bài viết, phù hợp nghe khi di chuyển. Muốn đọc chi tiết từng bước? Cuộn xuống bên dưới.

Thành thật mà nói: tuần này hơi phí

Mình có phỏng vấn online với một công ty tuần này. Cái phỏng vấn đó… vấp thật sự. Câu “hãy kể về kinh nghiệm làm việc của bạn” — nghe quen, nhưng khi ngồi thật sự trước camera thì không biết bắt đầu từ đâu. Gần 5 năm làm freelance, không có sếp để refer, không có team để kể chuyện, không có title cụ thể trên CV. Chỉ có đống project mình tự làm, tự bán, tự triển khai — mà khi kể thành câu chuyện tuyển dụng thì… kỳ kỳ. Thêm cái lag internet lúc căng thẳng nữa là xong. Nhiều khả năng trượt rồi.

Cũng nhận thêm thư từ chối từ một bên freelance content creator ở Hàn Quốc. Cái này thì rõ ràng hơn rồi — không cần chờ.

Thế là tối đó mình mở manhua ra đọc cho quên chuyện. Xuyên không. Hơn 200 chap. Không phải đọc lướt — ngồi thưởng thức thật sự, cày cỡ 10 tiếng. Đến cuối thì mỏi mắt thật sự. Không muốn nhìn màn hình thêm một giây nào nữa.

Và lúc đó mình tự hỏi: ước gì có cái gì đọc to bài viết cho mình nghe, thay vì phải nhìn màn hình thêm. Thế là bật dậy đi tìm. Đây là những gì mình thử — và những gì thật sự có ích.

Nhu cầu thật

3 câu chuyện thật từ những người quanh mình

Nhìn lại thì đây không phải nhu cầu riêng của mình. Xung quanh mình, tuần này thôi, có ba câu chuyện thật với cùng một nhu cầu.

Chính mình

Hay đi bộ sau bữa tối và muốn nghe bài viết hay trong lúc đó, thay vì phải ngồi nhìn màn hình thêm sau một ngày dài — và sau hơn 200 chap manhua.

Cô của bạn mình

“Làm sao để nghe bài báo đọc to ra? Tiktoker thì nhảm, mà đọc chữ trên báo thì mỏi mắt quá.”

Bạn mình

Đi làm lại sau một năm nghỉ sinh em bé. Nhìn màn hình cả ngày ở văn phòng, về nhà không còn sức, nhưng vẫn muốn học thêm tài liệu mới để bắt kịp.

Cả ba đều muốn tiêu thụ nội dung bằng tai thay vì bằng mắt. Không phải nhu cầu công nghệ — chỉ là muốn nghe mà không cần nhìn màn hình thêm.

Hành trình thử

3 công cụ TTS — kết quả thật

TTS = Text to Speech — công cụ chuyển chữ thành lời đọc. Đây là thứ tự mình đã đi qua.

1
TTS ngay trên trình duyệt web — zero setup

Chrome / Firefox / Edge: Cài extension Read Aloud (miễn phí, có trên cả ba) → nhấn icon trên thanh địa chỉ là nghe cả trang. Hoặc bôi đen đoạn văn → chuột phải → “Đọc to lựa chọn” nếu dùng Chrome.

Microsoft Edge có thêm tính năng tích hợp sẵn: Nhấn F9 hoặc vào menu ⋯ → “Đọc to”. Giọng tiếng Việt dùng Neural TTS của Microsoft — nghe tự nhiên hơn giọng Chrome mặc định đáng kể. Trên điện thoại: tải Edge → mở bài viết → nhấn biểu tượng 🔊 trên thanh địa chỉ.

→ Zero setup, dùng được ngay. Chất lượng ở mức tạm — đủ để thử xem mình có thích nghe bài viết không trước khi đầu tư tool tốt hơn.

2
Supertonic + noi.py — offline, 10 giọng, miễn phí Mình đang dùng MacBook

Supertonic là công cụ TTS chạy hoàn toàn trên máy tính của bạn — không cần internet, không tốn tiền, có 10 giọng (5 nữ F1–F5, 5 nam M1–M5), tiếng Việt nghe tự nhiên hơn Chrome rất nhiều.

Mình nhờ Claude cài đặt và build thêm file noi.py — một wrapper đơn giản để ai cũng dùng được: mở file, thay văn bản, chọn giọng, chạy → ra file MP3 trên Desktop và tự động phát luôn.

Demo — Giọng Nữ F3, tốc độ 1.0×
Demo — Giọng Nam M5, tốc độ 1.0×

* Nội dung demo là đoạn đầu bài viết này, được tạo bằng Supertonic + noi.py trên MacBook.

Hướng dẫn cài đặt Supertonic + noi.py trên MacBook (từng bước) Nhấn để mở · dành cho người chưa quen kỹ thuật

Không cần biết lập trình. Chỉ cần làm đúng theo thứ tự bên dưới — khoảng 10–15 phút là xong.

1
Kiểm tra Python đã có trên máy chưa

Mở Spotlight (nhấn ⌘ + Space), gõ Terminal, nhấn Enter.

python3 –version

Gõ lệnh trên và nhấn Enter. Nếu thấy Python 3.x.x → sang bước 2. Nếu báo lỗi “command not found” → tải Python tại python.org/downloads/macos (bản mới nhất), cài bình thường như mọi ứng dụng.

2
Cài thư viện Supertonic

Trong Terminal, nhập lệnh sau và nhấn Enter:

pip3 install supertonic

Lệnh này sẽ tự tải và cài Supertonic. Có thể mất 1–3 phút, cứ để máy chạy. Khi thấy dòng “Successfully installed…” là xong.

3
Tải file noi.py về Desktop

Tải file noi.py từ link Google Drive bên dưới, rồi kéo thả vào Desktop (màn hình chính của MacBook).

→ Tải noi.py từ Google Drive

4
Mở noi.py bằng TextEdit và chỉnh nội dung

Chuột phải vào file noi.py trên Desktop → Open WithTextEdit.

Bạn sẽ thấy 3 chỗ cần chỉnh:

① VAN_BAN — dán nội dung bạn muốn nghe vào đây (giữa 3 dấu ngoặc """...""").
② GIONG — chọn giọng: "F1" đến "F5" là giọng nữ, "M1" đến "M5" là giọng nam.
③ TOC_DO — tốc độ đọc: 1.0 bình thường · 1.3 hơi nhanh · 1.6 nhanh.

Lưu file sau khi chỉnh: nhấn ⌘ + S. Nếu TextEdit hỏi “Keep .py extension?” → nhấn Use .py.

5
Chạy noi.py và nghe kết quả

Quay lại Terminal, nhập lệnh sau và nhấn Enter:

python3 ~/Desktop/noi.py

Máy sẽ xử lý khoảng 10–30 giây (tuỳ độ dài văn bản). Khi thấy dòng ✅ Xong!, file MP3 sẽ xuất hiện trên Desktop và tự động phát lên nghe.

Lần sau chỉ cần: mở noi.py → thay văn bản → lưu → chạy lệnh trên. Xong.

Điện thoại thì sao? Supertonic và noi.py yêu cầu Python chạy trực tiếp trên máy tính (Mac hoặc Windows) — không thể cài trên iPhone hay Android. Nếu bạn chủ yếu dùng điện thoại, hãy dùng Google Cloud TTS ở bước 3 — chạy được trên mọi trình duyệt, kể cả mobile.

→ Miễn phí, chạy offline hoàn toàn, chất lượng giọng tốt nhất trong tầm miễn phí. Nếu bạn dùng MacBook, đây là lựa chọn mình giới thiệu trước tiên.

3
Google Cloud TTS — chất lượng tốt nhất, mọi thiết bị Mình dùng hàng ngày

Đây là công cụ mình dùng thật sự để làm bản audio cho bài này và các bài trước. Giọng tiếng Việt của Google (Neural2) nghe gần như người thật — mình thấy rõ sự khác biệt so với bất kỳ TTS miễn phí nào khác.

Mình đã build sẵn một tool HTML để bạn dùng ngay: dán script vào → chọn giọng → nhấn tạo → tải MP3 về. Không cần cài gì, chỉ cần một API Key miễn phí từ Google (hướng dẫn bên dưới).

Demo — Giọng vi-VN-Neural2-D (Nam), tốc độ 0.95×

* Đoạn mở đầu bài viết này, tạo bằng Google Cloud TTS qua tool bên dưới.

🎙
MK. Google TTS Tool
Dán script vào, chọn giọng, chọn tốc độ → nhấn tạo → tải MP3 về máy. Tự động tách đoạn nếu bài dài, có tính năng gộp file. Hoạt động trên mọi trình duyệt — cả điện thoại.
Mở MK. Google TTS Tool →
Cách lấy Google Cloud API Key miễn phí (5 phút) Cần 1 tài khoản Google · miễn phí đến 1 triệu ký tự/tháng

Google TTS miễn phí cho đến 1.000.000 ký tự Neural2 mỗi tháng — đủ để tạo hàng giờ audio. Chỉ cần lấy API Key một lần, dùng mãi.

1
Vào Google Cloud Console

Truy cập console.cloud.google.com và đăng nhập tài khoản Google của bạn.

2
Tạo Project mới

Nhấn vào dropdown tên project ở thanh trên → New Project. Đặt tên bất kỳ (ví dụ: “mk-tts-tool”) → nhấn Create. Đợi 10–15 giây để tạo xong.

3
Bật API Text-to-Speech

Vào menu bên trái → APIs & ServicesLibrary. Tìm kiếm Cloud Text-to-Speech API. Nhấn vào kết quả → nhấn nút Enable.

4
Tạo API Key

Vào APIs & ServicesCredentials → nhấn + Create Credentials → chọn API Key. Một cửa sổ nhỏ hiện ra với API Key vừa tạo.

5
Dán vào tool và bắt đầu dùng

Copy API Key vừa tạo. Mở MK. Google TTS Tool, dán vào ô Google Cloud API Key ở đầu trang. Dán script → nhấn tạo → xong.

⚠ Giữ API Key bí mật — không paste lên mạng xã hội hay gửi cho ai. Key bị lộ, người khác có thể dùng quota của bạn.

→ Chất lượng tốt nhất hiện có, hoạt động trên mọi thiết bị qua trình duyệt, miễn phí đến 1 triệu ký tự/tháng. Đây là thứ mình dùng để tạo audio cho bài này.

Phát hiện quan trọng nhất

Công cụ chỉ là một nửa vấn đề

Sau khi thử hết các công cụ, mình nhận ra một điều mà không cái nào giải quyết được: nội dung viết để mắt đọc rất khác nội dung để tai nghe.

Khi đọc bằng mắt, bạn có thể lướt, đọc lại, nhảy đoạn. Khi nghe, bạn theo tuyến tính — và nếu văn bản dùng gạch đầu dòng, câu dài, số liệu dày đặc, nghe là khó theo dõi lắm.

Nghe máy đọc bài viết bình thường cũng giống nghe ai đó đọc to hướng dẫn sử dụng điều hòa — đúng từng chữ, nhưng vào tai không vào đầu.

Thế là mình thêm một bước nữa: dùng AI (Claude) để viết lại bài từ định dạng “mắt đọc” sang định dạng “tai nghe” trước khi đưa vào TTS. Giống như biên tập thành script podcast — câu chuyển tiếp tự nhiên, bỏ danh sách khô khan, giữ nguyên giọng của tác giả. Kết quả nghe dễ theo dõi hơn hẳn.

Lấy về xài

Prompt mình dùng để chuyển blog → script nghe

Đây là prompt mình đang dùng thật sự. Copy về, dán bài viết bất kỳ vào cuối, gửi cho Claude hoặc ChatGPT — ra script, dán vào Google TTS Tool là nghe được ngay.

Prompt chuyển blog thành script podcast tiếng Việt Nhấn để mở · có nút Copy

Paste bài viết vào chỗ [Dán nội dung blog vào đây] ở cuối, gửi cho Claude hoặc ChatGPT.

Bạn là người chuyển đổi blog post thành script podcast tiếng Việt tự nhiên. Tôi sẽ paste một bài blog. Nhiệm vụ: viết lại thành script đọc to cho podcast — không phải đọc nguyên blog, không phải bản tin. GIỌNG TÁC GIẢ Tác giả viết như đang nói chuyện với bạn thân — thẳng thắn, hay tự nhận lỗi mình, chia sẻ thất bại nhỏ một cách thoải mái, nhưng luôn dẫn về bài học có ích. Giọng văn viết và giọng nói là một — giữ nguyên cách dùng từ, cách chuyển ý của bài gốc. Không “cải thiện” hay “nâng cấp” giọng văn. CHUYỂN BLOG SANG PODCAST Blog để đọc bằng mắt. Podcast để nghe bằng tai. Hai thứ khác nhau: – Bỏ những phần chỉ tồn tại cho người đọc: link, chú thích hình, bảng biểu. – Chuyển câu văn viết sang câu nói: “Theo nghiên cứu, X” thành “Có một nghiên cứu cho thấy X”. “Như đã đề cập ở trên” thành “Như mình vừa nói”. – Heading không đọc thẳng — chuyển thành câu dẫn: “Phần đầu tiên mình muốn nói về…”. – Câu chuyển ý có bridge mềm: “Quay lại chuyện chính…”, “Còn một điều nữa…”, “Nhưng mà…”. – Không cắt ý. Không tóm tắt. Không giới hạn thời lượng. NHỊP CÂU CHO TTS – Độ dài câu giữ tự nhiên theo nhịp nói — không cắt cứng theo số chữ. – Dùng dấu ba chấm (…) chỗ muốn ngừng lâu hơn dấu phẩy. – Xuống dòng nhiều hơn bình thường — mỗi xuống dòng là một nghỉ ngắn. – Bỏ ký tự đặc biệt: gạch ngang, dấu sao, thăng, gạch đầu dòng. Thay bằng “một là”, “hai là” hoặc xuống dòng. CLEAN UP CHO TTS ENGINE – Số viết thành chữ: “117” thành “một trăm mười bảy”, “30%” thành “ba mươi phần trăm”. – Viết tắt đọc đủ: “AI” thành “A I”, “TTS” thành “T T S”. – Xóa hoàn toàn: đường link URL, dấu ngoặc (), [], “”, emoji. – Tên riêng tiếng Anh giữ nguyên: Canva, ChatGPT, Notion, Claude. NGUYÊN TẮC TỔNG – Không thêm ý mới ngoài bài gốc. – Không bỏ ý quan trọng nào của tác giả. – Không tóm tắt — viết lại đầy đủ theo mạch của bài gốc. – Có thể thêm một câu transition nhỏ để nghe tự nhiên hơn, nhưng không đổi ý. – Output chỉ là script thuần — không header, không ghi chú, không phần giải thích. [Dán nội dung blog vào đây]
Chọn theo bạn

Bạn là ai → dùng cái gì

Có MacBook, muốn chạy offline
Supertonic + noi.py

Miễn phí hoàn toàn, chạy không cần mạng. Xem hướng dẫn cài ở trên.

Tải noi.py →
Dùng điện thoại hoặc muốn tốt nhất
Google Cloud TTS Tool

Chạy trên trình duyệt, mọi thiết bị. Cần API Key (lấy miễn phí, 5 phút).

Mở tool →
Muốn nghe tự nhiên như podcast
Prompt ở trên + bất kỳ TTS nào

Chuyển bài viết → script qua Claude/ChatGPT, rồi đưa vào TTS. Nghe khác hẳn.

Thử ngay, không muốn cài gì
TTS ngay trên trình duyệt web

Extension Read Aloud (Chrome/Firefox/Edge) hoặc tính năng “Đọc to” tích hợp của Edge. Zero setup.

Cài Read Aloud →

Nếu bạn thấy hữu ích, gửi bài này cho 1 người hay than “mỏi mắt đọc báo”. Chỉ cần nhắn: “Mở link này, dán bài vào, nhấn tạo — là có audio nghe đi bộ rồi.”

Tuần sau · Số 004

STT — ngược lại hoàn toàn với bài này

Bài này mình nói về TTS: chuyển chữ thành lời. Tuần sau mình lật ngược lại: STT (Speech to Text) — chuyển lời thành chữ.

Và ironically, một phần bài này mình viết bằng cách nói vào điện thoại trong lúc đi bộ tối qua — AI transcribe lại thành notes. Đó là STT đang hoạt động. Mình chưa tận dụng hết công cụ này cho công việc, và bài 004 sẽ là hành trình mình làm điều đó — kèm hướng dẫn cụ thể.

💬 Câu hỏi mình sẽ trả lời: Nói vào điện thoại thì dùng app gì để ra văn bản đẹp nhất? Và làm sao để từ giọng nói thành bản nháp bài viết chỉ trong 15 phút đi bộ?
MK. — Kaita

MK. ra mỗi tuần, miễn phí.

AI Marketing Ops cho SME Việt · build in public · kể thật, không PR.
Đăng ký để nhận bài mới thẳng vào hộp thư — không spam, không quảng cáo.

Mỗi tuần một bài · có thể huỷ bất cứ lúc nào

MK. Số 003 · 14/06/2026 · AI Marketing Ops cho SME Việt MK. · kaitago.com

Đọc thêm

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *