<br><br><div class="gmail_quote">On Mon, Jun 30, 2008 at 3:14 AM, Asheesh Laroia &lt;<a href="mailto:openmoko@asheesh.org">openmoko@asheesh.org</a>&gt; wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="Ih2E3d">On Mon, 30 Jun 2008, saurabh gupta wrote:<br>
<br>
&gt; You have identified the correct and justified problem in training. I thought<br>
&gt; to handle it in this way. Whenever a user runs this application, the GUI for<br>
&gt; speech recognition will ask it to go in training or recognition mode. In<br>
&gt; training mode, after uttering a word, the GUI will again ask the user to<br>
&gt; utter the same word again and so on. The user will have to feed the training<br>
&gt; word three times (I have assumed that constant to be three) to fully create<br>
&gt; a word in the vocabulary. If the user terminates the application or<br>
&gt; mishandles it before three sequences, the application will not save the<br>
&gt; word.<br>
<br>
</div>What do you mean mishandles?</blockquote><div>&nbsp;</div><div>Mishandling the application meant that the user didn&#39;t train the word fully at the time of training.&nbsp; <br></div><div>&nbsp;</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="Ih2E3d"><br>
&gt; However there is no easy way to detect the mishandling since if the user<br>
&gt; neither terminates the application nor speaks training word again,<br>
&gt; application can pick the louder noise thinking it as the training word<br>
&gt; and wrong result will be produced. This is always a bigger problem in<br>
&gt; speech related applications since environment noise as well as end point<br>
&gt; detection is quite difficult in real world scenario.<br>
<br>
</div>You are speaking of the &quot;training mode&quot;, which I agree is important.<br>
<br>
I am instead talking about making the normal use mode a training mode, in<br>
a way, to non-intrusively improve accuracy.<br>
<br>
At least, that&#39;s my guess - I think it would be worthwhile to run some<br>
experiments to see if it&#39;s really true! &nbsp;But if you can explain to me why<br>
this idea is invalid from the start than maybe we can skip the<br>
experiments. (-;<br>
</blockquote><div><br>Correct me if I am not getting exactly what you really meant to say. <br><br>As you said, to use the normal mode as a training mode, then I see a problem in it. Suppose a user trains a word e.g. &quot;hello&quot; insufficiently, then there are chances that the application recognizes a wrong or mispronounced word as this word (i.e. &quot;hello&quot;) because of a poor HMM model. Now if it uses this new word to improve the previous trained model (for the word &quot;hello&quot;), then it will turn out to be a completely wrong trained word since the word which is recognized is itself not correct. This can be solved to make it a manual procedure, that is, when the application recognizes a word then it asks the user if it was a correct word or not. If it is correct then it will use that to improve the previous model since the model was not fully trained. But again this will require the use of a lot of memory to store the word and much processing. <br>
Also as this application implements vector quantization so a codebook of each word is to be prepared during training. The best way to prepare a proper codebook is to have enough training vectors, which should be used together to create this codebook. <br>
<br>&nbsp;</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
-- Asheesh.<br>
<font color="#888888"><br>
--<br>
Clear the laundromat!! &nbsp;This whirl-o-matic just had a nuclear meltdown!!<br>
</font><div><div></div><div class="Wj3C7c"><br>
_______________________________________________<br>
Openmoko community mailing list<br>
<a href="mailto:community@lists.openmoko.org">community@lists.openmoko.org</a><br>
<a href="http://lists.openmoko.org/mailman/listinfo/community" target="_blank">http://lists.openmoko.org/mailman/listinfo/community</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Saurabh Gupta<br>Electronics and Communication Engg.<br>NSIT,New Delhi, India<br>I blog here: <a href="http://saurabh1403-blog.blogspot.com/">http://saurabh1403-blog.blogspot.com/</a><br>
<br>