מילון עברי-אנגלי
מטרת פרויקט המילון של קולמוס היא לספק למשתמש דובר העברית מילונים חופשיים על בסיס המאגרים הקיימים ברשת ומחוץ לה.
בשלב זה הפרויקט מתמקד במילון עברי-אנגלי.
העדכון האחרון: 25 בספטמבר 2014.
להורדה
העדכון כולל:
- מילון עברי-אנגלי מבוסס על ויקימילון. תאריך בסיס הנתונים: 6 בספטמבר 2014
- מילון עברי-אנגלי מבוסס על לקסיקון של מיל"ה גרסה 2.0. תאריך בסיס הנתונים: 11 ביוני 2007
- מילון עברי-אנגלי של אברהם שלמה ולדשטיין. תאריך העדכון: 25 בספטמבר 2014
כיצד מתקינים?
ההוראות להלן מתייחסות לאובונטו, אבל הרעיון העקרוני תקף לכל ההפצות של לינוקס.
- מתקינים את חבילת dictd שמהווה התשתית של המילונים למיניהם. זהו למעשה שרת שיספק את ההגדרות המילוניות לתוכנת לקוח שתותקן בשלב הבא.
- מתקינים את תוכנת הלקוח לפי טעמכם. משתמשי KDE יכולים להתקין את dikt או את kdict, שתיהן תוכנות קטנות וחביבות למדי.
- מורידים ופורסים את חבילת המילונים העבריים מאתר זה.
- נכנסים לחשבון משתמש root.
- מעתיקים את הקבצים עם הסיומות dict.dz ו-index לתיקיה /usr/share/dictd/.
- מריצים את הפקודה dictdconfig -w כדי לעדכן את קבצי ההגדרות של dictd במילונים החדשים.
- מאתחלים מחדש את dictd באמצעות הפקודה /etc/init.d/dictd restart
- פותחים את תוכנת הלקוח ונכנסים להגדרות. ב-kdict ניתן לעשות זאת ע"י בחירה של "Settings->Configure Dictionary..." ובחירה בסעיף Server.
- מגדירים Hostname: localhost, ומשאירים את הפורט כמו שהוא (אמור להיות 2628).
- כעת המילון מוכן לשימוש.
רשיון
- הסקריפטים להמרה בין בסיסי הנתונים השונים, להתקנה ולבנייה הם ברשות הציבור.
- קובץ הנתונים של מילון עברי-אנגלי המבוסס על ויקימילון מופץ ברשיון CC BY-SA 3.0.
- קובץ הנתונים של מילון עברי-אנגלי המבוסס על הלקסיקון של מיל"ה מופץ ברשיון GPL.
- קובץ הנתונים של מילון עברי-אנגלי של אברהם שלמה ולדשטיין נמצא ברשות הציבור.
איך זה עובד
הרעיון הוא די פשוט. לוקחים קובץ מידע של ויקימילון, למשל, והופכים אותו בשלושה צעדים לפורמט DICT שהוא הפורמט הנפוץ למילונים בלינוקס, וישנו מספר רב של תוכנות התומכות בו. בשלב ראשון סקריפט של Perl מנתח את הויקימילון, זורק מידע שאין לו שימוש כרגע, ואת המידע השימושי, כגון ערכים ותרגום שלהם, פולט לקובץ XML בפורמט פשוט שאני המצאתי לצורך זה. בשלב שני עוד סקריפט של Perl לוקח את קובץ ה-XML הפשוט וממיר את המידע שבו לפורמט FOLDOC. את ה-FOLDOC הופכים ל-DICT עם פקודה סטנדרטית. ניתן להבין את התהליך ביתר פירוט כשמעיינים בקבצי סקריפטים ובקובץ build.sh שבתוך חבילת קוד המקור.
סטטיסטיקה
גרסה |
מספר ערכים |
ויקימילון |
לקסיקון מיל"ה |
מילון ולדשטיין |
20080822 |
4055 |
- |
- |
20080919 |
4055 |
5306 |
- |
20081128 |
4055 |
5306 |
126 |
20090427 |
4523 |
5306 |
277 |
20090618 |
5427 |
5306 |
277 |
20110109 |
7906 |
5306 |
277 |
20110130 |
7963 |
5306 |
277 |
20120121 |
8285 |
5306 |
277 |
20120218 |
8341 |
5306 |
277 |
20120304 |
8358 |
5306 |
401 |
20120602 |
8410 |
5306 |
726 |
20120903 |
8441 |
5306 |
966 |
20130112 |
8487 |
5306 |
1282 |
20140925 |
11393 |
5306 |
1328 |