<div dir="ltr">I think it should be done in the following order:<br>- If hspell doesn&#39;t have it add for each word if it&#39;s a verb adjective and so on.<br>- Grammatical analyzer - I saw a doc work that was released under GPL about it long ago.<br>
- Grammatical fixer (maybe better spelling suggestion based on grammar<br>- Independent of that we need a list of words and their nikud (I also saw one in that doc work)<br>- Nikud checker<br>- Nakdan <br><br>Does anyone know where will be a good place to start getting word list with nikud?<br>
Or where is the doc work that made grammatical analyzer?<br><br>Ely<br><div class="gmail_quote">On Fri, Jan 1, 2010 at 10:18 AM, Dan Kenigsberg <span dir="ltr">&lt;<a href="mailto:danken@cs.technion.ac.il">danken@cs.technion.ac.il</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Who said anything about *few* rules? They are many, and are complex, and have<br>
gazillion of exceptions. But they exist, and putting them into effect in<br>
hspell&#39;s inflection scripts is doable, albeit requiring a lot of meticulous<br>
work. The classical references for niqqud are Luah HaShemot HaShalem and Luah<br>
HaP`alim HaShalem by Shaul Bakali. These tables include all the rules and all<br>
the exceptions needed to add the correct niqqud to Hebrew words.<br>
<div><div></div><div class="h5"><br>
On Fri, Jan 01, 2010 at 02:02:21AM +0200, Ely Levy wrote:<br>
&gt; I can only talk from my own experience, I couldn&#39;t find any good source for<br>
&gt; rules about nikud and grammar in a simple form.<br>
&gt; I did find some gpled work list with nikud, and I think I even talked to the<br>
&gt; people in mila.<br>
&gt; But no one could provide that few rules you are talking about.<br>
&gt; (And I&#39;m still confused about the difference between old and modern<br>
&gt; grammar/nikud...)<br>
&gt;<br>
&gt; Ely<br>
&gt;<br>
&gt; On Thu, Dec 31, 2009 at 4:11 PM, Nadav Har&#39;El &lt;<a href="mailto:nyh@math.technion.ac.il">nyh@math.technion.ac.il</a>&gt;wrote:<br>
&gt;<br>
&gt; &gt; On Thu, Dec 31, 2009, E L wrote about &quot;Re: Announce: Hspell 1.1&quot;:<br>
&gt; &gt; &gt; I think the main problem is what need to be done and not the man power to<br>
&gt; &gt; &gt; program it.<br>
&gt; &gt; &gt; If someone know of what are the rules grammar or nikud checkers should<br>
&gt; &gt; &gt; follow I&#39;m sure it won&#39;t be a big<br>
&gt; &gt; &gt; deal programing one<br>
&gt; &gt;<br>
&gt; &gt; I beg to differ.<br>
&gt; &gt;<br>
&gt; &gt; First of all, most of the needed knowledge already exists, published in<br>
&gt; &gt; numerous papers and books, and demonstrated by several pieces of commercial<br>
&gt; &gt; software. One doesn&#39;t need to come with advanced knowledge of the topic,<br>
&gt; &gt; any more than I had to be some spell-checking expert before I started<br>
&gt; &gt; Hspell.<br>
&gt; &gt; All one needs is a willingness to learn, and of course the resourcefulness<br>
&gt; &gt; to put it into good use.<br>
&gt; &gt;<br>
&gt; &gt; Second, while the work on Hspell had a lot of very interesting theoretical<br>
&gt; &gt; sides and problems to solve (in linguistics, language, compression, etc.),<br>
&gt; &gt; most of the work was actually the mundane and almost endless task of making<br>
&gt; &gt; lists of words (a task which you can see, still isn&#39;t done 10 years after<br>
&gt; &gt; starting the project). For niqqud checking, there is also a lot of similar<br>
&gt; &gt; mundane work that needs to be done (writing the right niqqud for each<br>
&gt; &gt; word),<br>
&gt; &gt; and that takes a lot of time.<br>
&gt; &gt; For grammar checking, it depends what you call grammar: If you also want<br>
&gt; &gt; to include semantics, and not just grammar - like Prof. Uzzi Ornan did in<br>
&gt; &gt; his text-to-speech and niqqud research (and product) - there&#39;s also tons<br>
&gt; &gt; of work that needs to be done on creating classes of nouns, listing<br>
&gt; &gt; arguments<br>
&gt; &gt; of verbs, and so on. I guess you can start with just grammar, though, and<br>
&gt; &gt; in this case, you&#39;re right - it should be doable without too much data<br>
&gt; &gt; collection - so maybe this is indeed a good project to start with.<br>
&gt; &gt;<br>
&gt; &gt; This is all very interesting work. Unfortunately, I do not see myself<br>
&gt; &gt; starting it in the near future. If anyone is interested in taking a shot<br>
&gt; &gt; at it, I&#39;d love to advise - please contact me and/or Dan privately.<br>
&gt; &gt;<br>
&gt; &gt; Nadav.<br>
&gt; &gt;<br>
&gt; &gt; --<br>
&gt; &gt; Nadav Har&#39;El                        |     Thursday, Dec 31 2009, 14 Tevet<br>
&gt; &gt; 5770<br>
&gt; &gt; <a href="mailto:nyh@math.technion.ac.il">nyh@math.technion.ac.il</a><br>
&gt; &gt; |-----------------------------------------<br>
&gt; &gt; Phone +972-523-790466, ICQ 13349191 |I couldn&#39;t afford a cool signature, so<br>
&gt; &gt; I<br>
&gt; &gt; <a href="http://nadav.harel.org.il" target="_blank">http://nadav.harel.org.il</a>           |just got this one.<br>
&gt; &gt;<br>
<br>
</div></div><div><div></div><div class="h5">&gt; _______________________________________________<br>
&gt; Linux-il mailing list<br>
&gt; <a href="mailto:Linux-il@cs.huji.ac.il">Linux-il@cs.huji.ac.il</a><br>
&gt; <a href="http://mailman.cs.huji.ac.il/mailman/listinfo/linux-il" target="_blank">http://mailman.cs.huji.ac.il/mailman/listinfo/linux-il</a><br>
<br>
<br>
</div></div><font color="#888888">--<br>
Dan Kenigsberg        <a href="http://www.cs.technion.ac.il/%7Edanken" target="_blank">http://www.cs.technion.ac.il/~danken</a>        ICQ 162180901<br>
</font></blockquote></div><br></div>