--- title: Vietnamese News Topic Classifier emoji: 📰 colorFrom: indigo colorTo: pink sdk: gradio app_file: app.py license: other tags: - text-classification - vietnamese - news - logistic-regression - scikit-learn - tf-idf - gradio model: - vanhai123/Vietnamese-news-classifier-model sdk_version: 5.32.1 --- # 📰 Vietnamese News Topic Classifier 🔎 Dự đoán chủ đề của đoạn tin tức tiếng Việt bằng mô hình **Logistic Regression + TF-IDF**. Ứng dụng này được huấn luyện trên dữ liệu tiêu đề tin tức thuộc 5 chủ đề: - 📘 **Giáo dục** - ⚽ **Thể thao** - 🎬 **Giải trí** - 💻 **Công nghệ** - 🏛️ **Chính trị** --- ## 🛠 Mô hình - ✅ Logistic Regression (scikit-learn) - ✅ TF-IDF Vectorizer - ✅ Train bằng Python (sklearn), lưu bằng joblib - ✅ Mô hình được lưu trữ tại: [vanhai123/Vietnamese-news-classifier-model](https://huggingface.co/vanhai123/Vietnamese-news-classifier-model) --- ## 🚀 Cách hoạt động 1. Người dùng nhập đoạn văn bản tiếng Việt (ví dụ: tiêu đề bài báo) 2. Văn bản được tiền xử lý (`lowercase`) 3. Vector hóa bằng TF-IDF 4. Dự đoán nhãn bằng Logistic Regression 5. Trả về tên chủ đề phù hợp --- ## 📦 Công nghệ sử dụng - `gradio` cho giao diện demo - `scikit-learn` cho mô hình học máy - `huggingface_hub` để tải mô hình từ repo --- ## 📚 Cách huấn luyện mô hình (tham khảo) Bạn có thể xem mã nguồn huấn luyện tại GitHub repo: 👉 [https://github.com/vanhai123/gginhir-news-classifier](https://github.com/vanhai123/gginhir-news-classifier) --- ## ✨ Demo Hãy thử nhập: - `"Học sinh được miễn học phí từ năm học mới"` - `"Apple ra mắt mẫu MacBook mới dùng chip AI"` - `"Đội tuyển Việt Nam chiến thắng thuyết phục"` --- ## 👤 Tác giả **vanhai123** - Hugging Face: [https://huggingface.co/vanhai123](https://huggingface.co/vanhai123) - GitHub: [https://github.com/vanhai1231](https://github.com/vanhai1231) --- ## 📄 Giấy phép Chỉ sử dụng cho mục đích học tập và nghiên cứu.