Hiện nay, các sách, báo, bài hướng dẫn chuyên ngành Máy Học tiếng Việt, cũng như các luận văn Thạc sĩ, Tiến sĩ hầu hết đều sử dụng các thuật ngữ tiếng Anh, và nếu có dịch ra tiếng Việt thì cũng chưa có được sự thống nhất. Tôi thực hiện dự án này trước hết là để cung cấp tài liệu học cho cá nhân tôi, và cũng như mong rằng có thể hỗ trợ trong việc Việt hoá tài liệu chuyên ngành Máy Học và Trí tuệ nhân tạo ở Việt Nam
Bản thuật ngữ này trước tiên tập trung vào dịch lại bản thuật ngữ tiếng Anh. Tiếp đó, cần thu thập thêm thuật ngữ từ nhiều nguồn khác để làm mới và mở rộng kho thuật ngữ này. Đường dẫn tới kho thuật ngữ: https://ml-glossary-vn.readthedocs.io/vi/latest/
Rất mong nhận được sự hỗ trợ và đóng góp từ mọi người.
- Clone kho chứa nội dung
git clone https://github.com/trgiangdo/ml-glossary-vn.git
- Cài đặt các gói cần thiết
Mục này giả sử bạn đã cài đặt các thư viện thường dùng trong lập trình máy học: numpy
, scipy
, v.v.
Chạy các câu lệnh sau trên cửa sổ lệnh (terminal).
pip install sphinx sphinx-autobuild
pip install sphinx_rtd_theme
pip install recommonmark
Với python-3.x trên môi trường Linux, sử dụng:
pip3 install sphinx sphinx-autobuild
pip3 install sphinx_rtd_theme
pip3 install recommonmark
- Xem trước các thay đổi của bạn
Với Windows, chạy các lệnh:
cd ml-glossary
cd docs
build.bat html
Nếu bạn sử dụng make
trên môi trường Linux:
cd ml-glossary
cd docs
make html
-
Xác nhận các thay đổi của bạn bằng cách mở tệp
index.html
trong thư mục_build/
sử dụng trình duyệt bất kỳ và tìm đến mục bạn thay đổi
Bạn có thể báo cáo lỗi hoặc đề xuất thêm bớt nội dung bằng cách tạo một issue mà không cần phải tạo pull request.
Bạn cũng có thể tham gia phản biện (review) các Pull Request theo Hướng dẫn dành cho người phản biện tại đây.
Mỗi đầu mục trong bản thuật ngữ PHẢI đảm bảo các tiêu chí tối thiểu sau:
- Giải thích ngắn gọn - càng ngắn gọn và súc tích càng tốt, nhưng đừng ngắn quá.
- Trích dẫn - đến các bài báo khoa học, hướng dẫn, v.v.
Để tăng tính tường minh, các đầu mục cũng có thể bao gồm:
- Hình minh hoạ - sơ đồ, biểu đồ, hoạt hoạ, hình ảnh.
- Code - các mẩu code python/numpy, class hoặc các hàm minh hoạ.
- Phương trình - theo cú pháp Latex.
Bạn cũng có thể đề xuất một pull request "thô" mà không cần hình minh hoạ hay code để trình bày ý tưởng của mình, và có thể nhờ đến sự giúp đỡ của cộng đồng đề cải thiện bản đề xuất của bạn.