|
از استخراج كلمات پركاربرد زبان به تفكيك موضوعي مي توان در سيستم هايي كه خاص منظوره طراحي مي شوند استفاده كرد و همانطور كه در قسمت استفاده از كلمات پركاربرد به طور كلي توضيح داده شد، تعريف مجموعه كلمات و مجموعه واژگان (كه براي توليد آن از آمار كلمات پركاربرد زبان استفاده مي شود) در استفاده از مدل زباني ضروري و لازم است. با استفاده از پيكره متني زبان فارسي، كلمات پركاربرد هر يك از حوزه هاي سياسي، هنري، ورزشي، فرهنگي، پزشكي و ... با تعداد كلماتي در حدود 10000 كلمه به دست آمده اند كه در سيستم هاي مرتبط با هر يك از اين حوزه ها مي توان از اين اطلاعات استفاده كرد.
|