Một trong những mục đích ban đầu của dự án này chính là khuyến khích cộng đồng tự tạo nhóm thực hiện các dự án dịch sách tương tự. Vì thế, chúng tôi xin chia sẻ kinh nghiệm một cách chân thực nhất, bao gồm cả những mặt chúng tôi thực hiện tốt và chưa tốt, kèm theo số liệu và văn bản thực tế để các anh chị em có sự chuẩn bị tốt hơn cho mình.
1. Tôn chỉ & Mục đích của nhóm DLBookVN
1.1. Tôn chỉ
Phi lợi nhuận. Chúng tôi không tính tiền công dịch thuật trên sách, cố gắng làm giá sách thấp nhất có thể sao cho vẫn đủ để đảm bảo chất lượng sách, đủ trang trải cho khâu lưu trữ, marketing, phân phối sách. Số ít còn dư (nếu có) sẽ quyên góp toàn bộ cho chương trình Sách hóa nông thôn Việt Nam của anh Nguyễn Quang Thạch.
Chất lượng. Chúng tôi lựa chọn quyển Deep Learning vì tính bao quát của nó. Đây được xem như là sách giáo khoa nhập môn của các sinh viên, kĩ sư muốn tìm hiểu và áp dụng học sâu. Chúng tôi tập trung vào chất lượng dịch, chăm chút cho phần thuật ngữ, bổ sung chú thích, diễn giải thêm để độc giả tiện đọc.
Tôn trọng bản quyền. Chúng tôi thống nhất ngay từ ban đầu là sẽ tôn trọng bản quyền một cách tuyệt đối. Chúng tôi cũng có kế hoạch mua bản quyền để xuất bản sách ngay khi nhóm mới hình thành. Trên thực tế, vấn đề bản quyền chưa được coi trọng đúng mức ở Việt Nam trong nhiều trường hợp. Thông qua công tác bản quyền của nhóm, chúng tôi hi vọng sẽ góp phần nâng cao nhận thức về vấn đề bản quyền hơn nữa trong cộng đồng.
1.2. Mục đích
Tạo nguồn tài liệu tiếng Việt tin cậy, chuẩn mực cho ngành AI/ML/DL tại Việt Nam.
Góp phần chuẩn hóa thuật ngữ cho lĩnh vực AI/ML/DL sử dụng trong giảng dạy, văn bản khoa học, hành chính bằng tiếng Việt. Theo đó, chúng tôi đã công bố toàn bộ phụ lục thuật ngữ, xem phần (1.3).
Tạo cảm hứng, khuyến khích các hoạt động nâng cao tri thức cho cộng đồng công nghệ Việt Nam. Và do đó, chúng tôi luôn nỗ lực làm giá sách nằm trong mức mà đông đảo sinh viên, người đi làm có thể chi trả và sẵn sàng chi trả.
2. Cách thức tổ chức
Trách nhiệm tổ chức nhóm chủ yếu do 3 người đồng sáng lập nhóm điều hành, sắp xếp theo thứ tự bảng chữ cái:
Nguyễn Ánh Dương: người đầu tiên kêu gọi thành lập nhóm, tham gia dịch thuật và hiệu chỉnh toàn bộ cuốn sách.
Lê Việt Hùng: cố vấn về dịch thuật, các kiến thức toán học và AI/ML/DL chuyên sâu, tham gia hiệu chỉnh toàn bộ cuốn sách.
Trần Duy Thanh: tạo kênh slack, quản lí tài khoản email nhóm, web, phân chia công việc, giám sát tiến độ, cố vấn dịch thuật ngữ, đặc biệt là yếu tố Hán-Việt trong thuật ngữ, hiệu chỉnh toàn bộ cuốn sách.
Trong quá trình dịch, có thời điểm số thành viên của nhóm lên tới 100 người. Anh Lê Việt Hùng đề xuất mô hình tổ chức như sau:
Chia công việc theo chương. Cụ thể, số người dịch mỗi chương tỉ lệ theo độ dài của chương sách. Trung bình mỗi thành viên dịch 5 trang—cuốn sách 500 trang và chúng tôi có đến 100 người. Số lượng trang/mỗi thành viên không nhiều, và vấn đề tốn nhiều thời gian nhất không phải là dịch, mà là đảm bảo tính nhất quán trong dịch thuật, khiến cho cuốn sách 100 người dịch có thể đọc như chỉ một người dịch.
Biên tập chương. Mỗi chương có một đến hai người được chỉ định làm biên tập chương (chapter editors). Vai trò của người biên tập chương là đảm bảo tính nhất quán trong mỗi chương, đặc biệt là trong cách sử dụng thuật ngữ, và hành văn. Người biên tập chương có vai trò điều phối các thành viên tham gia dịch chương đó.
Biên tập tổng thể. Chúng tôi có 6 thành viên đảm nhận vai trò biên tập tổng thể (cross-chapter editors). Ban biên tập tổng thể sẽ đảm bảo nhất quán giữa các chương, từ thuật ngữ đến văn phỏng. Mỗi thành viên trong ban biên tập đều phải đọc đi đọc lại bản dịch nhiều lần để đảm bảo sự nhất quán.
Như đã nói ở trên, khâu biên tập tổng thể là khâu tốn nhiều thời gian nhất. Trong vài tháng đầu tiên từ khi thành lập nhóm, chúng tôi đã hoàn thành bản dịch nháp đầu tiên của cuốn sách. Tuy nhiên khâu biên tập tổng thể kéo dài 2-3 năm. (Sau khi bản nháp đầu tiên đã hoàn thành, hơn 90 người trong dự án không còn tiếp tục theo đuổi nữa.) Trong những năm đó, đã có thời điểm cả ban biên tập “đuối sức”, tưởng như không hoàn thành được dự án, do nhiều vấn đề phát sinh. Một phần do cuốn sách quá dài, và các kiến thức liên quan của các chương cuối cùng ở mức rất cao, bao hàm nhiều lĩnh vực khác nhau, khiên việc biên tập và hiệu chỉnh gặp rất nhiều khó khăn. Sau này nhờ có sự kiên trì của ban biên tập tổng thể, bao gồm 3 người đồng sáng lập nhóm và các thành viên, sắp xếp theo thứ tự bảng chữ cái:
mà dự án mới được hoàn thành. Chi là người đã vạch ra một kế hoạch tài chính thông minh và kế hoạch marketing cụ thể. Chi giúp cả nhóm “nhìn” thấy điểm cuối của dự án, tạo thêm động lực cho cả nhóm tập trung “chạy nước rút” giai đoạn cuối cùng, và kết thúc dự án.
Lời bình: Giai đoạn ban đầu dự án phát triển rất nhanh, cùng một số lượng lớn dịch giả. Nhưng sự thành/bại của dự án phụ thuộc chủ yếu vào một vài thành viên theo đuổi dự án đến cùng. Cũng có nghĩa là nhưng thành viên này đã hi sinh một lượng lớn thời gian và công sức cho dự án. Chúng tôi cho rằng đây là một kinh nghiệm quý báu trong những dự án phi lợi nhuận: ban sáng lập dự án nên tìm ra một số bạn tâm huyết cho dự án để theo đuổi đến cùng, và bản thân ban sáng lập cũng chuẩn bị tinh thần dành phần lớn thời gian của mình cho dự án.
3. Về dịch thuật
3.1 Đặt vấn đề
Những ai làm việc trong các ngành kĩ thuật ở thời đoạn công nghệ tân tiến không ngừng những năm gần đây đều gặp nhiều phiền toái trong vấn đề thuật ngữ như:
Không biết thuật ngữ Việt tương ứng là gì? Đã được dịch trước đó chưa?
Trình độ cá nhân không đủ khả năng dịch ra tiếng Việt, và đành xài tạm thuật ngữ tiếng Anh, hoặc dịch qua loa. Một số trường hợp cực đoan sẽ thường đổ lỗi cho tiếng Việt không chuẩn xác?!?
Tồn tại song song nhiều cách dịch cho cùng một thuật ngữ tiếng Anh đã có.
Vân vân và vân vân.
Xuất phát từ những bất tiện trên, tồn tại khuynh hướng trong cộng đồng kĩ thuật cho rằng không nên dịch, thậm chí là ngăn cản việc dịch thuật ngữ, dịch sách, blog,… sang tiếng Việt. Lí do chủ yếu bao gồm:
Tạo sức ép về nhu cầu học tiếng Anh cho thế hệ sau.
Tiếng Việt không diễn tả được chuẩn xác như tiếng Anh.
3.2 Quan điểm
Chúng tôi cho rằng cả hai lí do nêu trên đều thể hiện sự lười nhác cũng như thiếu hiểu biết của người dịch trong việc tìm hiểu tiếng Việt cũng như tiếng Anh. Có thể nói, để nguyên thuật ngữ tiếng Anh là một việc dễ dàng nhất mà ai cũng có thể thực hiện. Để dịch một thuật ngữ sang tiếng Việt, đôi khi chúng tôi phải nghiên cứu và tranh luận nhiều ngày. Tại sao chúng tôi phải dành nhiều thời gian cho dịch thuật ngữ? Đứng trên quan điểm của chúng tôi - những người mong muốn đưa kiến thức tới đông đảo độc giả và có nhiều năm kinh nghiệm giảng dạy/chia sẻ kiến thức - chúng tôi cho rằng:
Dịch thuật ngữ là cần thiết, để chúng ta có từ ngữ chuẩn chỉ cho các văn bản nghiên cứu khoa học bằng tiếng Việt.
Thuật ngữ Việt - một khi được dịch và chú thích cẩn thận - đặc biệt có lợi cho quá trình giảng dạy truyền bá kiến thức. Ngoài ra, người ngoài ngành kĩ thuật cũng dễ tiếp cận hơn. Người ta càng không biết thì người ta càng khó yêu mến (vô tri bất mộ). Việc phổ biến kiến thức nhân loại bằng tiếng mẹ đẻ giúp tiết kiệm thời gian cho độc giả. Nó giúp khơi gợi đam mê từ phía độc giả. Chúng tôi xin nói rõ: chúng tôi không bài trừ thuật ngữ tiếng Anh. Ngược lại, chúng tôi khuyến khích bạn đọc tìm hiểu thuật ngữ tiếng Anh gốc, thông qua việc chú thích thuật ngữ tiếng Anh gốc bên cạnh bản dịch. Việc này còn có thể tạo ảm hứng để độc giả có thêm động lực học tiếng Anh, hội nhập với thế giới. Chúng tôi muốn khuyến khích thế hệ trẻ bằng kiến thức và đam mê nảy sinh từ sự hiểu biết, chứ không phải bằng cách không dịch để ép người ta học ngoại ngữ.
Lạm dụng thuật ngữ Anh gây nhiều khó khăn không cần thiết cho các bạn mới nhập môn. Ngoài ra, còn làm tối nghĩa thuật ngữ, bởi đa phần người dùng chỉ coi đó như một tên riêng mà không để ý tới cắt nghĩa của thuật ngữ đó.
Dịch thuật ngữ yêu cầu sự hiểu biết tương đối sâu về:
(1) Từ nguyên (etymology) của tiếng Anh.
(2) Từ nguyên của tiếng Việt.
(3) Kiến thức chuyên ngành.
(4) Một số trường hợp cần đến cả lịch sử, bối cảnh ra đời của chính thuật ngữ đó.
Phải biết thuật ngữ Anh để tiện tra cứu và tìm hiểu sâu, cập nhật với thế giới. Việc sử dụng song ngữ mang lại nhiều lợi thế về tư duy cho người học.
Nên phát triển khả năng tiếng Việt cho cộng đồng kĩ thuật. Đặc trưng của văn phong bình dân/nghệ thuật là “khơi gợi”, một chút nhập nhằng sẽ làm tăng tính khơi gợi, sự khéo léo vận dụng tính nhập nhằng của ngôn ngữ là một loại nghệ thuật. Đặc trưng của văn phong khoa học là “đặc tả”, tính đơn nghĩa và tường minh được đề cao nhằm tránh hiện tượng “tam sao thất bản”. Tiếng Việt, Anh (và các ngôn ngữ phát triển khác) đều có cả 2 văn phong đó. Sự phát triển của nền khoa học tại Việt Nam sẽ thúc đẩy phát triển văn phong khoa học của tiếng Việt. Chúng ta may mắn kế thừa di sản tiếng Việt ngàn năm của tổ tiên, đây là một ngôn ngữ cực kì phong phú và chuẩn xác, và ta cần biết tận dụng nó. Đa phần người học tiếng Anh tiếp xúc đầu tiên với văn phong khoa học, đặc biệt là người đi du học và làm kĩ thuật, ít tiếp xúc với văn phong bình dân (vì không sống đủ lâu trong cộng đồng bản địa tiếng Anh) nên thường có cảm nhận rằng tiếng Anh đơn nghĩa và chuẩn. Mặt khác, việc tiếp xúc thường xuyên với văn phong bình dân trong cộng đồng tiếng Việt bản địa, và thời gian tiếp xúc với văn phong khoa học của tiếng Việt rất hạn chế, do đó dễ sinh cảm giác tiếng Việt nhập nhằng kém chuẩn xác. Vì tiếng Việt là tiếng mẹ đẻ của ta, nên ta dễ lầm rằng mình hiểu rõ tiếng Việt.
Một số thuật ngữ trong cuốn sách chúng tôi giữ nguyên bản gốc tiếng Anh, một phần là do chúng tôi thất bại trong việc tìm thuật ngữ tiếng Việt tương đương. Quyết định giữ nguyên tiếng Anh trong bản dịch đều phải được sự đồng ý của tất cả các biên tập viên, từ biên tập chương cho tới biên tập tổng quát.
Tuy chưa hoàn hảo, nhưng chúng tôi cuối cùng khá hài lòng với bộ thuật ngữ của mình, và chúng tôi hi vọng cộng đồng sẽ phổ biến hoặc/và tiếp tục hành trình tìm thuật ngữ tiếng Việt chuẩn của chúng tôi.
3.3 Tiêu chí dịch thuật ngữ
Chúng tôi cho rằng một thuật ngữ tốt cần các tiêu chí sau:
Diễn tả tốt, hoặc gợi nhớ tốt nội hàm kĩ thuật.
Càng ít nhập nhằng với thuật ngữ khác càng tốt.
Ngắn gọn, súc tích.
Thân thiện, dễ hiểu (không dùng từ quá lạ, quá cổ)
Sát với thuật ngữ Anh (để dễ đoán ra thuật ngữ Anh tương ứng khi cần).
Trong quá trình giảng dạy/chia sẻ, chúng tôi mạnh dạn sử dụng đồng thời cả 2 bộ thuật ngữ. Trong đó, thuật ngữ Anh là để tiện tra cứu, và thuật ngữ Việt là để tiện giảng dạy. (Và dĩ nhiên chúng tôi cũng yêu mến tiếng mẹ đẻ nữa.) Chúng tôi đã đính kèm cuối sách hơn 600 thuật ngữ. Đây là thành quả mà nhóm muốn đóng góp cho cộng đồng. Chúng tôi đã đưa toàn bộ số thuật ngữ lên trang web này, mời bạn đọc xem tại đây: Phụ lục thuật ngữ.
4. Các công cụ hỗ trợ quá trình dịch
Facebook.
Đây là nơi chúng tôi tập hợp và khởi xướng dự án. Facebook cũng là kênh để chúng tôi cập nhật tiến độ của dự án tới cộng đồng, cũng như thông báo về Dự án xuất bản sách Học sâu.
Slack.
Cơ chế đa kênh, đa luồng, thông báo (channel, thread, notification) của slack giúp phân luồng chủ đề thảo luận và phối hợp hoạt động rất hiệu quả. Chúng tôi lập kênh riêng chuyên để thảo luận chuyên sâu về dịch thuật trên này.
GoogleSheet. Chúng tôi sử dụng Google Sheet để liệt kê các thuật ngữ đã dịch hoặc chưa dịch, các phương án dịch khả dĩ, ghi chú nhanh. Lí do:
Dễ sử dụng. Chúng tôi biết rằng anh em trong cộng đồng kĩ thuật thường dùng github/gitlab, cơ chế tạo issue, merge-request như trong trường hợp nhóm dịch cuốn sách Dive into Deep Learning (d2l-Thảo luận, d2l-Bảng thuật ngữ). Nhưng vì nhóm chúng tôi đa dạng thành viên với nhiều trình độ và lĩnh vực khác nhau nên GoogleSheet là phương án thích hợp hơn cả.
Dễ tìm kiếm, sắp xếp, thống kê.
Là công cụ trực tuyến, sao lưu tự động.
Bỏ phiếu. Chúng tôi đối chiếu với các tiêu chí dịch thuật như trên, trong trường hợp có nhiều cách dịch cùng thỏa mãn các tiêu chí đó, chúng tôi chọn hình thức bỏ phiếu để quyết định phương án chính thức.
hackmd.io.
Xem thêm tại đây. Ở giai đoạn đầu của dự án, cũng vì nhóm chúng tôi đa dạng thành phần, trình độ, lĩnh vực, vậy nên Latex không phải là công cụ phù hợp lúc này. Chúng tôi lựa chọn công cụ Hackmd vì các ưu điểm sau:
Rất dễ học, dễ sử dụng. Các thành viên mới chỉ cần 15-30p là đã có thể cùng sử dụng với nhóm.
Soạn thảo văn bản bằng Markdown cho định dạng nhất quán. Màn hình chia đôi cho phép xem trước (preview) văn bản kết quả ngay trong quá trình soạn thảo thô.
Hỗ trợ gõ công thức toán theo kiểu tương tự Latex.
Nhiều người có thể cùng tham gia chỉnh sửa đồng thời.
Có cho phép xuất (export) giao diện web.
Tự động sao lưu nội dụng và lịch sử thay đổi, từ đó dễ dàng truy lại hoặc đổi lại (revert) về phiên bản cũ một khi phát sinh sai sót. Chức năng này khá tương tự github/gitlab.
Gitlab.
Tại thời điểm năm 2018, chúng tôi nhận thấy Gitlab có nhiều tiện ích hỗ trợ phù hợp hơn là Github. Tuy nhiên, chỉ có ban quản trị sử dụng Gitlab nhằm mục đích sao lưu kết quả dịch thuật ứng với mỗi phiên bản ổn định mà thôi. Các thành viên khác đều dịch trên hackmd.io. Bên cạnh đó, chúng tôi sử dụng công cụ miễn phí, sẵn có là Gitlab Page để làm trang web chính thức cho nhóm, cũng như đăng tải các chương đọc thử, vinh danh ghi nhận đóng góp của các thành viên.
Latex.
Trong các lần hiệu chỉnh toàn bộ nội dung sách từ năm 2021, chúng tôi chính thức dừng sử dụng GoogleSheet và hackmd, chuyển hẳn sang dùng Latex và Gitlab làm công cụ chính vì:
Thành viên tham gia hiệu chỉnh chỉ còn vài người, chủ yếu là ban quản trị, đều có nhiều kinh nghiệm sử dụng Latex, Gitlab/Github.
Chuẩn hóa nội dung, định dạng, quy cách trình bày của sách, chuẩn bị cho khâu xuất bản.
Quản lí thuật ngữ. Chúng tôi sử dụng thư viện glossaries trong latex để quản lí số thuật ngữ này trong toàn bộ văn bản. Thư viện này giúp chúng tôi rất nhiều trong quá trình hiệu chỉnh sách. Với hơn 600 thuật ngữ, 20 chương sách với hơn 700 trang nội dung mà không có công cụ này thì thật là một vấn đề nhức đầu. GoogleSheet chỉ hiệu quả ở giai đoạn đầu, là lúc còn cần thảo luận nhiều mà thôi.
Adobe Illustrator & Photoshop. Có hơn 70 hình minh họa, đồ thị trong sách cần được vẽ lại (vector hóa) để đảm bảo chất lượng khi in ấn, ngoài ra cũng cần dịch phần nội dung trong ảnh.
5. Trở ngại và các vấn đề phát sinh
Chúng tôi xin nêu ra một vài trường hợp nổi bật nhằm mục đích chia sẻ với các bạn có ý định lập nhóm dịch sách, giúp các bạn chuẩn bị tinh thần cũng như dự trù các phương án xử lí phù hợp.
5.1. Thiếu tôn trọng bản quyền.
Về cơ bản, chúng tôi muốn tuân thủ luật bản quyền vì:
Góp phần tạo ấn tượng tốt với thế giới về môi trường học thuật, dịch thuật Việt Nam.
Muốn khuyến khích các nhóm dịch trong tương lai tuân thủ điều này.
Tránh các rắc rối pháp lí liên quan đến bản quyền có thể có cho các anh chị em tham gia dịch.
Tuy vậy, đã có trường hợp thành viên nhóm dịch cố ý rò rỉ bản dịch (chưa hiệu chỉnh) ra bên ngoài. Vậy phải xử lí thế nào? Chúng tôi chấp nhận rằng vấn đề này là không thể tránh khỏi, và cũng không có nhiều nguồn lực, thời gian để giải quyết rốt ráo. Chúng tôi lựa chọn ra thông báo trong nhóm và trên facebook để cộng đồng cùng biết về quan điểm của nhóm, và sau đó chỉ tập trung vào hoàn chỉnh chất lượng cho phiên bản chính thức.
5.2. Tài chính
Đa phần các nhóm hoạt động phi lợi nhuận hoặc từ thiện đều dễ gặp phải rắc rối tài chính. Chúng tôi không gặp phải vấn đề gì trong quá trình dịch sách, nhưng khi cần triển khai các bước xuất bản sách thì đây là vấn đề lớn. Chúng tôi sử dụng mở tài khoản thiện nguyện tại Ngân hàng Quân đội MBBank. Đây là loại tài khoản mà bất cứ ai (không phải chủ tài khoản) cũng có quyền yêu cầu sao kê tất cả các giao dịch chuyển tiền vào-ra. Điều này giúp giải phóng gánh nặng trách nhiệm cho cá nhân lập tài khoản. Nhóm gần như không cần đến nghiệp vụ kế toán hay tương tự. Hoạt động tài chính đều được đảm bảo minh bạch công khai tự nhiên thông quan tính năng sẵn có của loại tài khoản này. Các bạn có thể xem lịch sử giao dịch của chúng tôi tại đây Sao kê. Phía bên MBBank thường sẽ mất 1-2 tuần để thẩm định phê duyệt loại tài khoản thiện nguyện này (tại thời điểm tháng 11/2021). Nếu các bạn có ý định tạo tài khoản tương tự thì nên cân nhắc làm sớm.
5.3 Nghi ngờ nhau.
Một vài thành viên có thể có nghi ngờ với thành viên khác hoặc với ban quản trị. Các vấn đề nghi ngờ thường thấy là:
Ban quản trị giấu giếm thông tin.
Ban quản trị có ý tư lợi trên nội dung đã dịch.
Thành viên X có âm mưu tư lợi, có ý đồ riêng.
Phương án chúng tôi lựa chọn để giải quyết vấn đề:
Chủ động giao tiếp với thành viên có khúc mắc. Trong trường hợp khúc mắc là không thể giải quyết, chúng tôi lựa chọn dừng cộng tác.
Liên tục công khai thông tin (hàng tuần), minh bạch hoạt động của thành viên ban quản trị, cũng như tiến độ chung của toàn dự án.
Rà soát, dừng cộng tác với các thành viên ít hoạt động hoặc hoạt động không hiệu quả.
6. Thống nhất văn phong, hiệu chỉnh
Chúng tôi hoàn tất dịch thô trong vòng dưới 1 năm cho 20 chương sách với hơn 700 trang. Tuy vậy, khâu chiếm nhiều thời gian nhất, quyết định chất lượng cuốn sách là hiệu chỉnh. Các vấn đề nổi bật như:
Văn phong không đồng nhất. Dựa trên sự tín nhiệm, chúng tôi chọn ra một nhóm nòng cốt với 6 thành viên (theo thứ tự bảng chữ cái: Nguyễn Ánh Dương, Lê Việt Hùng, Võ Tấn Phát, Lê Thị Thùy Trang, Trần Duy Thanh, Nguyễn Xuân Tú) để hiệu chỉnh văn phong cho toàn bộ sách trong 4 đợt.
Hiểu nhầm ý tác giả. Đây là điều khó tránh khỏi khi nhóm có nhiều người cùng tham gia với nhiều trình độ khác nhau. Thực tình thì một phần cũng do có nhiều đoạn tác giả viết không rõ ý, hoặc viết lủng củng, hoặc cần kiến thức nền đủ sâu mới có thể nắm. Việc cắt cử nhóm nòng cốt để hiệu chỉnh toàn sách là phương án duy nhất chúng tôi đã tiến hành để rà soát các đoạn khả nghi này.
Lỗi chính tả. Chúng tôi sử dụng Google Docs để hỗ trợ phát hiện khoảng 70% các lỗi chính tả hiển nhiên, 30% lỗi còn lại chỉ có thể phát hiện thủ công bằng cách đọc rà soát từng chữ.
Thuật ngữ không đồng nhất. Phần lớn thuật ngữ là thống nhất trong nhóm, tuy vậy, do có nhiều cá nhân đồng thời chia ra dịch nhiều phần nên khó tránh khỏi việc thiếu nhất quán ở đâu đó. Một lần nữa, việc rà soát thủ công từng từ, đối sánh giữa bản dịch tiếng Việt và bản gốc tiếng Anh là cách thức sửa lỗi duy nhất mà chúng tôi đã thực hiện.
Luật chính tả y-i, luật bỏ dấu trên nguyên âm (ví dụ: òa-oà). Luật chính tả cho chữ Quốc ngữ có quy định rõ việc này. Tuy nhiên, vì thói quen vốn có và nhiều quan điểm khác nhau mà luật y-i và luật bỏ dấu thường không được mọi người tuân thủ chặt chẽ. Về phần mình, một mặt, chúng tôi tôn trọng sở thích, quan điểm cá nhân, một mặt khác, chúng tôi cũng khuyến khích tuân thủ luật chính tả này trong các văn bản đặc thù như khoa học, hành chính.
7. Số lượng thành viên, hiệu suất
Nhiều thành viên không đồng nghĩa với việc hoạt động hiệu quả. Việc quản lí 100 thành viên ngốn một lượng lớn thời gian của ban quản trị. Sẽ hiệu quả hơn nhiều nếu lượng thời gian này được ban quản trị sử dụng để dịch và hiệu chỉnh sách.
Sau khi hoàn tất xuất bản cuốn sách này, chúng tôi nhìn lại và cho rằng: số thành viên tham gia lí tưởng cho dự án này là khoảng 10 người. Số thành viên tối thiểu để có thể chạy dự án trơn tru là 5 người. Lợi thế của nhóm ít người là gì?
Nhóm gắn bó hơn, hoạt động hiểu ý nhau hơn, khả năng trình độ cũng gần nhau hơn.
Thông tin nhanh chóng phổ biến cập nhật trong nhóm, do đó giảm thiểu các sai lệch, hoặc thiếu nhất quán trong quá trình dịch sách.
Thời gian dùng cho quản lí nhóm không đáng kể, do đó có nhiều thời gian để chăm chút cho sách hơn.
Vậy nhóm nhiều người là không tốt sao? Thưa không, thực ra nhóm 100 người cũng có lợi thế của nó:
Tính lan tỏa của dự án mạnh mẽ hơn, và cũng nhờ đó mà kết nối được với nhiều thành viên rất chất lượng.
Tuyển chọn được những thành viên đặc thù, chẳng hạn như thành viên chuyên hiệu chỉnh ảnh trong sách.
Nhiều bạn rất nhiệt tình phụ giúp các công việc mang tính thủ công như là:
Rà soát lỗi chính tả.
Rà soát công thức.
Rà soát thuật ngữ thiếu nhất quán.
Một số bạn ít tham gia dịch, nhưng lại nhiệt tình sử dụng kiến thức thu nhặt được trong quá trình phụ dịch cho các dự án đào tạo huấn luyện khác của bạn, và do đó giúp chúng tôi càng nhận thấy rõ ý nghĩa thực tế của dự án chúng tôi đang tiến hành.
Nhóm dịch sách cần những thành viên như thế nào?
Chuyên gia. Trong trường hợp của nhóm chúng tôi thì đó là anh Lê Việt Hùng, Ngô Quốc Hưng. Ngoài ra thời gian đầu nhóm chúng tôi còn rất nhiều thành viên là tiến sỹ, nghiên cứu sinh, và thạc sỹ.
Quản trị. Trong khoảng thời gian cao điểm với 20-60 thành viên cùng lúc thì bạn Trần Duy Thanh kiêm nhiệm vai trò này. Về sau, khi chỉ còn 3-15 người thì vai trò này gần như không còn cần thiết nữa.
Marketing và các công việc liên quan hợp đồng, đàm phán. Lúc đầu nhóm không có người chuyên trách, bạn Trần Duy Thanh kiêm nhiệm và không hiệu quả. Về sau, bạn Lại Ngọc Chi (với nhiều kinh nghiệm trong lĩnh vực xuất bản sách) tham gia vào nhóm đã cho thấy nhiều cải thiệt rõ rệt. Nếu không, có thể phải tốn thêm gần cả năm nữa thì sách mới đến được tay độc giả. Trong trường hợp không có thành viên như vậy, chúng tôi nghĩ các bạn nên tìm kiếm sự hỗ trợ từ các cá nhân tích cực đang làm việc trong ngành xuất bản để có hướng dẫn chi tiết. Nhóm chúng tôi sẵn sàng chia sẻ kinh nghiệm, hoặc bạn cũng có thể liên hệ với nhóm của anh Vũ Hữu Tiệp.
Đội ngũ dịch thuật thường trực.
Nhiệt tình vừa đủ. Đủ tức là có thể theo một dự án cho đến khi hoàn thành hoặc trong một thời gian đủ dài để hoàn thành trọn vẹn một vài chương sách, nhưng không quá nhiệt tình đến mức tự tạo sức ép cho bản thân và người khác, cũng không nên thất thường đến nỗi các đầu việc đã nhận lại làm lỡ dở.
Năng lực. Theo quan sát của chúng tôi, các bạn có từ 5 năm kinh nghiệm về lập trình hoặc toán, khoa học dữ liệu, làm việc trong môi trường thường xuyên sử dụng tiếng Anh, tài liệu tiếng Anh, có ít nhất 3 năm kinh nghiệm đi dạy hoặc chia sẻ, từng tự dịch bài dịch sách, có khả năng diễn đạt trôi chảy thì cũng thường là những bạn có hiệu suất và chất lượng dịch ổn nhất.
Thái độ cởi mở. Kiến thức rộng lớn và có nhiều lắt léo, đây đó nhiều chỗ dịch sẽ dẫn đến tranh luận kèm theo các luồng ý kiến khác nhau. Điều may mắn là anh chị em chúng tôi đều khá nghiêm túc, cởi mở và không kém phần hài hước trong các tranh luận học thuật. Công việc dịch sách khó nhằn, và chúng tôi vẫn có những niềm vui, tiếng cười sảng khoái khi làm việc cùng nhau.
Trên đây là kinh nghiệm vận hành thực tế 1 dự án phi lợi nhuận, có yêu cầu học thuật cao, hoàn toàn trực tuyến, với số lượng nhân lực lớn trong 1 năm đầu và số lượng nhân lực nhỏ trong 2 năm cuối, nhân lực rải rác ở nhiều nơi khắp Việt Nam và thế giới. Hi vọng sẽ giúp ích cho các bạn trong quá trình tạo lập nhóm dịch thuật cho riêng mình.
8. Bản quyền
8.1 Các loại bản quyền
Khởi đầu dự án này, hiểu biết của chúng tôi về các loại bản quyền gần như bằng 0. Sau này, khi bắt đầu tính đến đường xuất bản, chúng tôi được biết các loại bản quyền sau:
Bản quyền tác giả. Nói nôm na thì bản quyền này cho ta biết sách (bản gốc tiếng Anh) thuộc quyền sở hữu của ai.
Bản quyền xuất bản. Trong trường hợp của chúng tôi, thì nhà xuất bản (NXB) MIT là đơn vị nắm giữ bản quyền xuất bản (dù đó là bản dịch ra ngôn ngữ nào). Bạn muốn phát hành sách giấy hay ebook của quyển Deep Learning bằng tiếng Anh, Việt, Hoa, Nhật… thì cũng đều phải đàm phán với NXB MIT.
Bản quyền bản dịch. Nhóm chúng tôi dịch ra tiếng Việt, vậy thì chúng tôi có quyền đi đăng kí bản quyền của bản dịch này. Để xuất bản sách thì không cần làm bước này, tuy vậy, để tránh các rắc rối pháp lí về sau, nhóm chúng tôi được khuyên rằng nên đăng kí bản quyền bản dịch từ sớm.
Theo đó, để có thể in được 1000 quyển sách giấy, chúng tôi chỉ cần bản quyền xuất bản từ NXB MIT mà thôi. Nói cách khác, chúng tôi không cần phải liên hệ với 3 tác giả của sách này.
8.2 Tìm kiếm nhà xuất bản cộng tác
Lúc đầu, nhóm chúng tôi dự định phát hành bản trực tuyến (online), hoàn toàn miễn phí cho cộng đồng. Sau hơn 1 năm tìm kiếm hỗ trợ (kể từ lúc hoàn tất hiệu chỉnh đợt 1), chúng tôi rất tiếc là không tìm được cách mua bản quyền để thực hiện mong muốn đó. Cách khả thi nhất là phát hành sách giấy. Phương án này dễ dàng hơn nhiều vì có rất nhiều NXB trong nước có nhiều năm kinh nghiệm cho việc này. Chúng tôi nhanh chóng liên hệ được với một số NXB và sau cùng lựa chọn NXB Thế Giới làm đơn vị cộng tác.
8.3 Ủy quyền mua bản quyền xuất bản
Theo kinh nghiệm của người trong ngành xuất bản, chúng tôi được khuyên là nên cộng tác với một NXB trong nước, để thuê họ liên hệ đàm phán và kí hợp đồng với NXB MIT.
Chúng tôi đã thuê NXB Thế Giới đứng ra làm đại diện kí hợp đồng cho phép xuất bản 1000 quyển sách giấy phiên bản tiếng Việt với NXB MIT.
Hợp đồng thuê dịch vụ mua bản quyền phát hành sách với NXB Thế Giới:
Hợp đồng với NXB MIT
9. Sản phẩm hoàn chỉnh
Trong trường hợp phát hành sách giấy, ngoài việc hoàn thành nội dung sách, chúng tôi còn cần chú ý đến rất nhiều chi tiết nhỏ, mất khoảng 3-4 tháng mới có thể hoàn thành. Gồm:
9.1 Thiết kế bìa
Bạn có thể tự thiết kế, hoặc thuê thiết kế riêng, hoặc có thể đặt hàng thuê chính NXB mà bạn đang cộng tác thiết kế. Và dù chọn phương án nào, thì bạn cũng cần phải trao đổi tham khảo ý kiến của NXB liên tục, vì thiết kế bìa liên quan tới nhiều yếu tố như:
Các kĩ thuật in bìa (và kèm theo đó là các mức chi phí khác nhau)
Độ dày gáy sách và thiết kế cho gáy (liên quan chặt chẽ tới số lượng trang và loại giấy ruột)
Logo hình ảnh của đơn vị tài trợ (nếu có)
Trích đoạn, thông tin tác giả, dịch giả trên phần tay gập hoặc cuối sách…
9.2 In ấn bằng tập tin Latex
Nếu bạn bàn giao tập tin định dạng doc, hoặc docx, NXB có thể tự xử lí dàn trang, chế bản. Trong trường hợp xuất bản sách chuyên ngành kĩ thuật, chúng ta thường dùng Latex, và chúng tôi thấy rằng không có công cụ nào có thể chuyển từ Latex sang doc/docx mà vẫn đảm bảo chất lượng. Vì lí do này, chúng tôi đã làm việc chặt chẽ với NXB để nắm rõ quy cách trình bày (canh lề trái phải trên dưới, cỡ chữ, font, bố cục, vị trí đặt hình ảnh…) và tự mình hiệu chỉnh theo đúng quy cách đó. Cuối cùng, chúng tôi bàn giao tập tin pdf. Nhà xuất bản sẽ in ấn dựa theo tập tin pdf này.
9.3 Chất liệu giấy ruột, kích cỡ sách.
Sách chúng tôi hơn 700 trang, hơn 70 ảnh màu, một số ảnh cần rất nhiều màu, do đó cần chọn loại giấy ruột phù hợp để khi in ra không bị nhòe, lệch màu, hoặc giấy quá mỏng mực trang sau làm mờ trang trước, hoặc giấy quá dày làm tăng độ dày của sách.
Nếu khổ sách quá nhỏ, chúng tôi phải dàn trang lại thì số trang sẽ tăng lên. Còn nếu khổ sách quá lớn, khi đó khâu vận chuyển sẽ cần hộp lớn hơn, và khách hàng sau này khi sử dụng cũng khó mang theo hơn. Khổ sách chúng tôi đã chọn là xấp xỉ kích cỡ trang giấy A4.
9.4 Thông tin bổ sung theo sách
Gồm:
Lời nhận xét cho sách. Chúng tôi đã gửi một phần hoặc toàn bộ nội dung cho những chuyên gia người Việt hàng đầu trong lĩnh vực AI/ML/DL để xin phản hồi, góp ý và viết lời nhận xét cho sách.
Thông tin nhà tài trợ. Vì đây là một trong số các quyền lợi chúng tôi dành để tri ân các nhà tài trợ, vì vậy chúng tôi đã làm việc với các nhà tài trợ để lấy các thông tin cần thiết. Trong trường hợp nhà tài trợ công ti, việc này sẽ cần nhiều thời gian hơn. Chúng tôi mất tầm 1 tháng để hoàn tất việc lấy thông tin nhà tài trợ, xét duyệt nội dung đăng lên sách, lấy ý kiến nhà tài trợ để chỉnh sửa cho phù hợp.
Thông tin thành viên nhóm dịch. Có thành viên muốn đăng tên họ đúng trên khai sinh, có thành viên chỉ muốn dùng biệt danh (nickname) hoặc tên tự đặt, và có thành viên xin được giấu tên… Chúng tôi tôn trọng nguyện vọng của từng thành viên. Do đó, ngay từ những ngày đầu cùng nhau dịch sách, chúng tôi đã xin ý kiến và đăng thông tin vinh danh (hoặc giấu tên) các thành viên theo nguyện vọng của mỗi người. 4 tháng trước khi in ấn chính thức, chúng tôi cũng đã thông báo rộng rãi một lần nữa để các thành viên điều chỉnh nếu cần.
Lời nói đầu.
Mã ISBN - International Standard Book Number (Mã số tiêu chuẩn quốc tế cho sách). Mỗi phiên bản ấn hành và mỗi thay đổi (trừ khi in lại) của một quyển sách sẽ có số ISBN riêng. Tuy nhiên bạn không cần quá lo lắng, thường thì NXB sẽ giúp hoàn tất các thủ tục cần thiết để xin mã ISBN cho sách. NXB Thế Giới cũng đã nhiệt tình hỗ trợ chúng tôi trong việc này.
9.5 Chương đọc thử
Chúng tôi chọn chương 1, chương dễ đọc nhất làm chương đọc thử chính thức và đăng tải lên trang web của nhóm.
Bên cạnh đó, tùy theo từng trường hợp, chúng tôi cũng gửi 3-4 chương đọc thử hoặc toàn bộ bản thảo của sách cho các thầy, các chuyên gia để giúp thẩm định chất lượng dịch, xin ý kiến, góp ý để có những chỉnh sửa phù hợp, và những lời nhận xét phục vụ cho khâu marketing khi bán sách.
10. Huy động kinh phí in sách
10.1 Chuẩn bị
Gồm:
Tài khoản. Chúng tôi tạo tài khoản thiện nguyện tại ngân hàng MBBank như đã đề cập ở phần (2.2.2)
Báo giá. Chúng tôi xin báo giá từ phía NXB để biết số lượng in tối thiểu (mà NXB chấp nhận in). Tổng chi phí tương ứng với số lượng sách in ra. Chi phí này cũng phụ thuộc nhiều vào các yếu tố như đã đề cập ở phần (4).
Sau khi có báo giá, chúng tôi lên kế hoạch marketing, dự trù chi phí lưu kho, đóng gói, giao sách, khuyến mại, quỹ dự phòng,… Mục đích là tính ra được số tiền cần có ứng với từng giai đoạn:
Giai đoạn in sách.
Giai đoạn phân phối sách đã đặt trước.
Giai đoạn bán số sách còn lại với các đợt khuyến mãi cho đến khi chấm dứt dự án.
Dựa trên con số đó, chúng tôi chia nhỏ nhà tài trợ tiềm năng thành nhiều nhóm và tiến hành kêu gọi tài trợ làm 2 đợt với các chính sách và thời điểm kêu gọi tương ứng. Song song với đó, chúng tôi tiến hành mở đợt đặt trước (pre-order) với khuyến mãi lớn.
10.2 Soạn hồ sơ kêu gọi tài trợ và triển khai
Chúng tôi hướng đến kêu gọi hai nhóm nhà tài trợ:
Các công ti, trường đại học trong lĩnh vực AI/ML/DL. Hầu hết là các công ti chúng tôi có quen biết, từng làm việc hoặc từng có thời gian cộng tác trong nhiều hoạt động học thuật khác nhau. Đây cũng là những cá nhân, tổ chức biết rõ nhóm chúng tôi, tin tưởng vào tôn chỉ hoạt động và hiểu nỗ lực của nhóm, cũng như đánh giá cao tác động của dự án lên cộng đồng. Họ là những nhà tài trợ tâm huyết, cũng là những người bạn tuyệt vời của chúng tôi. Có thể nói, nếu không có sự hỗ trợ của họ thì chúng tôi khó có thể nhanh chóng huy động đủ chi phí để xuất bản sách kịp tiến độ. Đây là đối tượng chúng tôi tiến hành kêu gọi tài trợ vào đợt 1, tháng 11/2021.
Các cá nhân (kĩ sư, chuyên gia, sinh viên cao học) và cộng đồng. Chúng tôi hiểu rằng đây đó sẽ có nhiều anh chị em trong cộng đồng muốn đóng góp cho dự án. Dĩ nhiên họ không thể có số tiền lớn như các tổ chức, công ti, nhưng với lòng nhiệt tình, họ sẵn sàng ủng hộ chúng tôi trong khả năng tài chính của mình. Chúng tôi cũng dành một khoảng nhỏ trong sách để tri ân tấm lòng nhiệt tình đó. Đây là đối tược chúng tôi tiến hành kêu gọi tài trợ vào đợt 2, tháng 12/2021.
Bạn có thể tham khảo hồ sơ kêu gọi tài trợ (proposal) dưới đây:
Đặt trước (Pre-Order). Thông qua mạng lưới fanpage, group facebook của nhóm và của các anh em quen biết trong cộng đồng, đã có hơn 300 đơn đặt hàng trước từ phía độc giả. Đồng thời, cũng nhờ hình thức đặt trước này mà chúng tôi có thể ước lượng mức độ đón nhận của độc giả, từ đó quyết định số lượng in cho phù hợp. Với hơn 300 đơn đặt trước, chúng tôi tự tin rằng gần 700 quyển sách còn lại có thể được bán hết trong vòng 1 năm, từ đó đi đến quyết định in tổng cộng 1000 quyển, đúng bằng số lượng tối đa đã kí trước đó với bên NXB MIT.
Các bạn có thể tham khảo bài đặt trước của chúng tôi tại đây
10.4 Số liệu thực tế
Chúng tôi xin công khai con số để các bạn tham khảo trong trường hợp các bạn muốn lập nhóm dịch thuật xuất bản sách:
Tính theo thời giá tháng 12/2021:
Báo giá từ phía NXB (in 1000 quyển, 720 trang/quyền, 70 trang in màu, bìa mềm tay gập): ~185.000.000 VND
Phí bản quyền phát hành tối đa 1000 quyển thanh toán cho NXB MIT và NXB Thế Giới: ~19.000.000 VND
Tổng tiền huy động từ nhà tài trợ công ti, tổ chức: 110.000.000 VND
Tổng tiền huy động được từ nhà tài trợ cá nhân: 17.000.000 VND
Tổng tiền huy động qua kênh đặt trước (pre-order): ~90.000.000 VND
11. Lời kết
Trên đây là toàn bộ thông tin quá trình hình thành, tổ chức, cũng như hoạt động của nhóm dịch sách học sâu DLBookVN. Thông qua việc chia sẻ kinh nghiệm, chúng tôi hi vọng rằng sẽ có nhiều hơn nữa những tổ chức dịch sách phi lợi nhuận như chúng tôi. Nền khoa học và công nghệ ở Việt Nam cần thêm nhiều dự án như vậy.
12. Danh sách các thành viên của nhóm.
(Tên của các thành viên được sắp xếp theo thứ tự bảng chữ cái)