<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>OpenIA on Simple Enough Blog</title><link>https://blog-dev.simpleenough.net/fr/tags/openia/</link><description>Recent content in OpenIA on Simple Enough Blog</description><generator>Hugo</generator><language>fr</language><lastBuildDate>Wed, 26 Mar 2025 09:05:00 +0100</lastBuildDate><atom:link href="https://blog-dev.simpleenough.net/fr/tags/openia/index.xml" rel="self" type="application/rss+xml"/><item><title>1000 le nombre magique dans le monde des LLM</title><link>https://blog-dev.simpleenough.net/fr/blog/chunk/</link><pubDate>Wed, 26 Mar 2025 09:05:00 +0100</pubDate><guid>https://blog-dev.simpleenough.net/fr/blog/chunk/</guid><description>&lt;h2 id="i-taille-des-chunks--pourquoi-1000-tokens-" class="heading">I. Taille des chunks : pourquoi ~1000 tokens ?&lt;a href="#i-taille-des-chunks--pourquoi-1000-tokens-" aria-labelledby="i-taille-des-chunks--pourquoi-1000-tokens-">
&lt;!-- &lt;i class="fas fa-link anchor">&lt;/i> -->
 &lt;svg class="svg-inline--fa fas fa-link anchor" fill="currentColor" aria-hidden="true" role="img" viewBox="0 0 640 512">&lt;use href="#fas-link">&lt;/use>&lt;/svg>&amp;nbsp;
 &lt;/a>
&lt;/h2>
&lt;p>La valeur par défaut de &lt;strong>1000 tokens par chunk&lt;/strong> n’est pas arbitraire :&lt;/p>
&lt;ul>
&lt;li>Un chunk de cette taille contient généralement &lt;strong>assez d&amp;rsquo;information pour être sémantiquement cohérent&lt;/strong>, sans être trop lourd.&lt;/li>
&lt;li>Il reste &lt;strong>compatible avec les fenêtres contextuelles&lt;/strong> des LLMs modernes (4k, 8k, 32k voire 1M tokens).&lt;/li>
&lt;li>Il évite de &lt;strong>diluer la compréhension&lt;/strong> ou de casser des unités de sens.&lt;/li>
&lt;/ul>
&lt;p>Certains cas nécessitent des tailles différentes :&lt;/p></description></item></channel></rss>