<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Everyday on Simple Enough Blog</title><link>https://blog-dev.simpleenough.net/fr/tags/everyday/</link><description>Recent content in Everyday on Simple Enough Blog</description><generator>Hugo</generator><language>fr</language><lastBuildDate>Tue, 01 Apr 2025 17:52:00 +0100</lastBuildDate><atom:link href="https://blog-dev.simpleenough.net/fr/tags/everyday/index.xml" rel="self" type="application/rss+xml"/><item><title>Comment bien compter les tokens ?</title><link>https://blog-dev.simpleenough.net/fr/blog/token/</link><pubDate>Tue, 01 Apr 2025 17:52:00 +0100</pubDate><guid>https://blog-dev.simpleenough.net/fr/blog/token/</guid><description>&lt;h2 id="i-quest-ce-quun-token-" class="heading">I. Qu’est-ce qu’un token ?&lt;a href="#i-quest-ce-quun-token-" aria-labelledby="i-quest-ce-quun-token-">
&lt;!-- &lt;i class="fas fa-link anchor">&lt;/i> -->
 &lt;svg class="svg-inline--fa fas fa-link anchor" fill="currentColor" aria-hidden="true" role="img" viewBox="0 0 640 512">&lt;use href="#fas-link">&lt;/use>&lt;/svg>&amp;nbsp;
 &lt;/a>
&lt;/h2>
&lt;p>Un &lt;strong>token&lt;/strong> est une unité de texte que le modèle traite. Il peut s’agir d’un mot entier, d’une partie de mot ou même d’un caractère spécial.&lt;/p>




&lt;h3 id="exemples-concrets" class="heading">Exemples concrets&lt;a href="#exemples-concrets" aria-labelledby="exemples-concrets">
&lt;!-- &lt;i class="fas fa-link anchor">&lt;/i> -->
 &lt;svg class="svg-inline--fa fas fa-link anchor" fill="currentColor" aria-hidden="true" role="img" viewBox="0 0 640 512">&lt;use href="#fas-link">&lt;/use>&lt;/svg>&amp;nbsp;
 &lt;/a>
&lt;/h3>






 






&lt;table class="table">
 &lt;thead>
 
 
 &lt;tr>
 &lt;th >Texte&lt;/th>
 &lt;th >Nombre de tokens&lt;/th>
 &lt;/tr>
 
 &lt;/thead>
 &lt;tbody>
 
 
 &lt;tr>
 &lt;td >Bonjour&lt;/td>
 &lt;td >1&lt;/td>
 &lt;/tr>
 
 
 
 &lt;tr>
 &lt;td >Je suis un développeur&lt;/td>
 &lt;td >5&lt;/td>
 &lt;/tr>
 
 
 
 &lt;tr>
 &lt;td >L’intelligence artificielle est fascinante !&lt;/td>
 &lt;td >9&lt;/td>
 &lt;/tr>
 
 
 
 &lt;tr>
 &lt;td >GPT est un modèle puissant.&lt;/td>
 &lt;td >6&lt;/td>
 &lt;/tr>
 
 &lt;/tbody>
&lt;/table>



&lt;h3 id="particularité-du-découpage-des-tokens" class="heading">Particularité du découpage des tokens&lt;a href="#particularit%c3%a9-du-d%c3%a9coupage-des-tokens" aria-labelledby="particularité-du-découpage-des-tokens">
&lt;!-- &lt;i class="fas fa-link anchor">&lt;/i> -->
 &lt;svg class="svg-inline--fa fas fa-link anchor" fill="currentColor" aria-hidden="true" role="img" viewBox="0 0 640 512">&lt;use href="#fas-link">&lt;/use>&lt;/svg>&amp;nbsp;
 &lt;/a>
&lt;/h3>
&lt;ul>
&lt;li>En anglais, les mots courts représente 1 token (ex. &lt;code>&amp;quot;Hello&amp;quot;&lt;/code> = 1 token).&lt;/li>
&lt;li>En français, certains mots longs peuvent être divisés en plusieurs tokens (ex. &amp;ldquo;développeur&amp;rdquo; ou &amp;ldquo;intelligence&amp;rdquo;` = 2 tokens).&lt;/li>
&lt;li>La ponctuation comptent aussi comme des tokens.&lt;/li>
&lt;li>Les espaces sont pris en compte avec le mot qui le suit.&lt;/li>
&lt;li>Les acronymes représente 1 token.&lt;/li>
&lt;/ul>
&lt;p>En moyenne, 100 tokens correspondent à environ 75 mots, bien que cela puisse varier selon la langue et le style d’écriture.&lt;/p></description></item></channel></rss>