Đề 18 - C. Phân tích từ khóa
Một nhà phân tích cần tìm ra từ khóa quan trọng nhất trong một đoạn văn bản. Tuy nhiên, đoạn văn bản gốc khá lộn xộn, chứa các chữ hoa/thường không nhất quán, dấu câu và các khoảng trắng thừa.
Để tìm được từ khóa, trước tiên cần chuẩn hóa văn bản theo các quy tắc sau:
1. Chuyển tất cả các chữ cái thành chữ thường.
2. Loại bỏ tất cả các ký tự không phải là chữ cái hoặc chữ số.
3. Các từ sau khi chuẩn hóa được cách nhau bởi một dấu cách duy nhất.
Sau khi chuẩn hóa, từ khóa quan trọng nhất được định nghĩa là từ xuất hiện nhiều lần nhất. Nếu có nhiều từ cùng xuất hiện nhiều lần nhất, từ khóa sẽ là từ đứng đầu tiên theo thứ tự từ điển.
Yêu cầu: Viết chương trình nhận vào một xâu S, chuẩn hóa nó và tìm ra từ khóa quan trọng nhất cùng số lần xuất hiện của nó.
Một dòng duy nhất chứa xâu ký tự S.
In ra trên một dòng duy nhất gồm từ khóa quan trọng nhất và số lần xuất hiện của nó, cách nhau bởi một dấu cách.
Độ dài của xâu S không vượt quá 2000 ký tự.
Xâu S chứa các ký tự ASCII cơ bản.
Đầu vào:
"Hoc, hoc nua, hoc mai." La mot cau noi hay, rat hay!!
Đầu ra:
hoc 3
Đầu vào:
Python is good, Java is also good.
Đầu ra:
good 2
Theo thứ tự từ điển, good đứng trước is. Do đó, good là từ khóa cần tìm.
Comments