מידע כללי
מבוא לעיבוד שפה טבעית. הקורס מציג שיטות לייצוג שפה אנושית ברמות שונות, החל מייצוגים פשוטים של אוספי מילים, דרך מודלים סדרתיים, וכלה במבנים תחביריים וסמנטיים. בכל רמה כזו, הקורס מפתח מספר מודלים ואלגוריתמים מבוססי למידת מכונה לפתרון בעיות שונות בעיבוד שפה טבעית, כגון סיווג מסמכים, תיוג רצפי מילים, ניתוח תחבירי של משפטים והפקת משמעות. הקורס דן במודלים כגון מסווג בייס נאיבי, רגרסיה לוגיסטית, מודל מרקוב חבוי, רשתות עצביות עמוקות מסוגים שונים, ואלגוריתמי למידה מתאימים לשערוך הפרמטרים שלהם. הקורס שם דגש על מימוש של מודלים קלאסיים ומודרניים בעיבוד שפה טבעית. תוצאות למידה: בסיום הקורס, הסטודנט/ית יהיה/תהיה מסוגל/ת: 1. למדל את הרמות הסטנדרטיות של מבנים בלשניים באמצעות דקדוקים פורמליים או מודלים סטטיסטיים וחישוביים. 2. לזהות ולהפעיל מתודולוגיה ניסויית נאותה לאימון ובדיקה של מערכות עיבוד שפה טבעית. 3. לחשב הסתברויות ולשערך פרמטרים של מודלים מובנים באמצעות שיטות למידה מונחית. 4. לממש מודלי שפה פשוטים ולהשתמש בהם ולהתאימם לטובת פתרון בעיות עיבוד שפה טבעית.
פקולטה: מדעי המחשב
|תואר ראשון
|תארים מתקדמים
מקצועות קדם
מקצועות ללא זיכוי נוסף
97215 - שיטות בעיבוד שפה טבעית 97216 - עיבוד שפה טבעית