<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>publishers &#8211; Botscorner</title>
	<atom:link href="https://www.botscorner.fr/tag/publishers/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.botscorner.fr</link>
	<description></description>
	<lastBuildDate>Wed, 09 Oct 2024 08:15:52 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.3.1</generator>

<image>
	<url>https://www.botscorner.fr/wp-content/uploads/2022/12/botfavicon-150x150.png</url>
	<title>publishers &#8211; Botscorner</title>
	<link>https://www.botscorner.fr</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>Le Botservatoire , le bulletin des crawlers commerciaux, n°12 – Adata.pro</title>
		<link>https://www.botscorner.fr/le-botservatoire-le-bulletin-des-crawlers-commerciaux-n12-adata-pro/</link>
		
		<dc:creator><![CDATA[Yan Gilbert]]></dc:creator>
		<pubDate>Wed, 09 Oct 2024 08:02:59 +0000</pubDate>
				<category><![CDATA[Non classé]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[bots]]></category>
		<category><![CDATA[botscorner]]></category>
		<category><![CDATA[copyright]]></category>
		<category><![CDATA[crawl]]></category>
		<category><![CDATA[dataset]]></category>
		<category><![CDATA[media monitoring]]></category>
		<category><![CDATA[press]]></category>
		<category><![CDATA[publishers]]></category>
		<category><![CDATA[scraping]]></category>
		<guid isPermaLink="false">https://www.botscorner.fr/?p=1338</guid>

					<description><![CDATA[Portrait-Robot de ADATA.PRO, une société multiservices (dataset for AI, media monitoring …) Les précédents botservatoires Tous les jours, des centaines de crawlers collectent des données sur les sites des éditeurs radio, TV, presse online &#38; print. Ils opèrent pour les activités de veille, des analyses, des résumés, fournissent le big data de qualité indispensable aux IA [&#8230;]]]></description>
										<content:encoded><![CDATA[
<p><strong>Portrait-Robot de ADATA.PRO, une société multiservices (dataset for AI, media monitoring …)</strong></p>



<figure class="wp-block-gallery has-nested-images columns-default is-cropped wp-block-gallery-1 is-layout-flex wp-block-gallery-is-layout-flex">
<figure class="wp-block-image size-large"><img fetchpriority="high" decoding="async" width="1020" height="460" data-id="1339" src="https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro0.jpg" alt="" class="wp-image-1339" srcset="https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro0.jpg 1020w, https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro0-300x135.jpg 300w, https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro0-768x346.jpg 768w" sizes="(max-width: 1020px) 100vw, 1020px" /></figure>
</figure>



<p><a href="https://www.botscorner.fr/bostcorner-blog/">Les précédents botservatoires</a></p>



<p>Tous les jours, des centaines de crawlers collectent des données sur les sites des éditeurs radio, TV, presse online &amp; print. Ils opèrent pour les activités de veille, des analyses, des résumés, fournissent le big data de qualité indispensable aux IA …</p>



<p><strong>ADATA.PRO, une société multiservices (dataset for AI, media monitoring …)</strong></p>


<div class="wp-block-image">
<figure class="aligncenter size-large is-resized"><img decoding="async" src="https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro2-1024x578.jpg" alt="" class="wp-image-1340" style="width:583px;height:329px" width="583" height="329" srcset="https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro2-1024x578.jpg 1024w, https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro2-300x169.jpg 300w, https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro2-768x433.jpg 768w, https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro2.jpg 1044w" sizes="(max-width: 583px) 100vw, 583px" /></figure></div>


<p>Parmi les très nombreux services offerts par <a href="https://adata.pro/" target="_blank" rel="noopener"><strong>Adata.pro</strong></a>, on peut trouver la rubrique «&nbsp;Data Solutions&nbsp;», présentée ainsi (extraits)<strong>&nbsp;:</strong></p>



<p><a href="https://adata.pro/" target="_blank" rel="noopener"><strong>Adata.pro</strong></a><strong> </strong>is a <strong>trusted partner to data and content aggregators</strong>, financial and risk &amp; compliance consultants, and PR agencies internationally.</p>



<p><strong>We specialise in content</strong>, data and business intelligence services, media monitoring and analysis. Our suite of services spans Data Automation, Data Management, and <a href="https://adata.pro/data-solutions/training-data-for-ai/" target="_blank" rel="noopener"><strong>Training Data for AI</strong></a></p>



<p>Our data automation solutions <a href="https://adata.pro/data-solutions/data-automation/?utm_source=training-data-for-ai-page&amp;utm_medium=related-solutions&amp;utm_campaign=ilb" target="_blank" rel="noopener"><strong>collect data from various sources</strong></a>, such as databases, APIs, and <strong>web scraping</strong>.</p>



<p><a href="https://adata.pro/" target="_blank" rel="noopener"><strong>Adata.pro</strong></a> est membre de <a href="https://www.updata.one/" target="_blank" rel="noopener">UpData One Community</a> une organisation qui regroupe des sociétés du secteur, et de <a href="https://www.fibep.info/" target="_blank" rel="noopener">FIBEP</a> (the world&#8217;s media intelligence association).</p>


<div class="wp-block-image">
<figure class="aligncenter size-full is-resized"><img decoding="async" src="https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro_3_updataone.jpg" alt="" class="wp-image-1341" style="width:584px;height:346px" width="584" height="346" srcset="https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro_3_updataone.jpg 849w, https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro_3_updataone-300x178.jpg 300w, https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro_3_updataone-768x455.jpg 768w" sizes="(max-width: 584px) 100vw, 584px" /></figure></div>


<p>Des <a href="https://adata.pro/blog/eu-grants-a-data-pro-milestone-projects/" target="_blank" rel="noopener">fonds Européens</a> aident A Data Pro à développer une <a href="https://adata.pro/blog/technology-for-producing-news-stories/" target="_blank" rel="noopener">technologie pour produire des articles de presse</a></p>



<p><strong>1. obéir à robots.txt</strong> les ips de Adata.pro présentent un user agent d&#8217;internaute accédant au site avec un navigateur. L’éditeur ne peut donc marquer son désaccord avec ce scraping par ce biais. Ces ips ne verraient de toutes façons pas cette indication, puisqu&#8217;elles ne passent pas sur le fichier robots.txt.</p>



<p><strong>2. Stats sur Botscorner</strong>.</p>



<p>Les stats Adata.pro, dont le service a été lancé en 1999, montrent une activité conséquente sur les sites équipés de Botscorner.</p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="770" height="462" src="https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro1.jpg" alt="" class="wp-image-1342" srcset="https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro1.jpg 770w, https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro1-300x180.jpg 300w, https://www.botscorner.fr/wp-content/uploads/2024/10/botservatoire_12-adatapro1-768x461.jpg 768w" sizes="(max-width: 770px) 100vw, 770px" /></figure>



<p><strong>3. Estimated Revenue, Valuation, employee data</strong></p>



<ul>
<li>Adata.pro estimated annual revenue is currently <a href="https://www.clodura.ai/directory/company/a-data-pro" target="_blank" rel="noopener">101-500M$ per year</a>.</li>



<li>Employee : <a href="https://profile.clustercollaboration.eu/profile/cluster-organisation-member/67df9746-e246-4020-9c5e-0cddd32eff7e" target="_blank" rel="noopener">352</a> (between <a href="https://www.clodura.ai/directory/company/a-data-pro" target="_blank" rel="noopener">201-500</a> )</li>
</ul>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Le Botservatoire , le bulletin des crawlers commerciaux, n°08 – You.com</title>
		<link>https://www.botscorner.fr/le-botservatoire-le-bulletin-des-crawlers-commerciaux-n08-you-com/</link>
		
		<dc:creator><![CDATA[Yan Gilbert]]></dc:creator>
		<pubDate>Tue, 31 Oct 2023 16:43:27 +0000</pubDate>
				<category><![CDATA[Non classé]]></category>
		<category><![CDATA[bots]]></category>
		<category><![CDATA[botscorner]]></category>
		<category><![CDATA[chatgpt]]></category>
		<category><![CDATA[crawl]]></category>
		<category><![CDATA[IA]]></category>
		<category><![CDATA[press]]></category>
		<category><![CDATA[publishers]]></category>
		<guid isPermaLink="false">https://www.botscorner.fr/?p=1269</guid>

					<description><![CDATA[un crawl sur les sites de presse, pour un moteur de recherches proposant des réponses sous forme de résumés des articles, et non de liens vers les articles]]></description>
										<content:encoded><![CDATA[
<p><strong>Portrait Robot de You.com , un moteur de réponses et de création de contenus.</strong></p>



<p><strong><a href="https://you.com/" data-type="link" data-id="https://you.com/" target="_blank" rel="noopener">YOU.COM</a>: &#8220;<em>immediate answers, no more scrolling through a list of blue links</em>”</strong></p>



<p>Tous les jours, des centaines de crawlers collectent des données sur les sites des éditeurs radio, TV, presse online &amp; print. Ils opèrent pour les activités de veille, des analyses, des résumés, fournissent le big data de qualité indispensable aux IA …</p>



<p><strong>You.com</strong> est un moteur de réponses aussi simple dans sa présentation que peut l’être Google&nbsp;: un logo et une barre de recherches.</p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="605" height="259" src="https://www.botscorner.fr/wp-content/uploads/2023/10/botservatoire8_youCOM_1.jpg" alt="" class="wp-image-1270" srcset="https://www.botscorner.fr/wp-content/uploads/2023/10/botservatoire8_youCOM_1.jpg 605w, https://www.botscorner.fr/wp-content/uploads/2023/10/botservatoire8_youCOM_1-300x128.jpg 300w" sizes="(max-width: 605px) 100vw, 605px" /></figure>



<p><strong>Le service</strong> a été <a href="https://techcrunch.com/2022/07/14/you-com-raises-25m-to-fuel-its-ai-powered-search-engine" data-type="link" data-id="https://techcrunch.com/2022/07/14/you-com-raises-25m-to-fuel-its-ai-powered-search-engine" target="_blank" rel="noopener">créé en 2020</a> par l’ancien fondateur de MetaMind-IA, racheté par SalesForce. Il bénéficie d’une levée de fonds de 45M$, ses revenus sont actuellement estimés à <a href="https://growjo.com/company/You.com" data-type="link" data-id="https://growjo.com/company/You.com" target="_blank" rel="noopener">15M$/an</a>.</p>



<p><strong>Modèle économique&nbsp;:</strong></p>



<p>Le service qui propose un “Chat GPT-4” service est gratuit dans une version de base non personnalisée, et devient payant (<a href="https://you.com/plans" data-type="link" data-id="https://you.com/plans" target="_blank" rel="noopener">9,99$/mois</a>) dès que l’on veut des réponses plus élaborées, ou créer des images, des résumés,&#8230;</p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="561" height="384" src="https://www.botscorner.fr/wp-content/uploads/2023/10/botservatoire8_youCOM_2.jpg" alt="" class="wp-image-1271" srcset="https://www.botscorner.fr/wp-content/uploads/2023/10/botservatoire8_youCOM_2.jpg 561w, https://www.botscorner.fr/wp-content/uploads/2023/10/botservatoire8_youCOM_2-300x205.jpg 300w" sizes="(max-width: 561px) 100vw, 561px" /></figure>



<p>Comme Google, il propose aux annonceurs des espaces publicitaires, sous forme d’<a href="https://about.you.com/fr/private-ads-on-you-dot-com/" data-type="link" data-id="https://about.you.com/fr/private-ads-on-you-dot-com/" target="_blank" rel="noopener">annonces privées</a></p>



<p><strong>comportement</strong></p>



<p><strong>-obéir à robots.txt</strong> : You.com passe sur robots.txt, mais ce service utilisant ChatGPT peut passer sur des sites qui ont interdit GPTbot.</p>



<p>&#8211;<strong>Un exemple de recherches</strong>  :L’éditeur peut constater les modalités d’emprunts de ses textes par ce moteur de réponses, en comparant l’article créé à partir d’un de ses articles scrapés. Exemple&nbsp;sur une recherche à partir du contenu d’un article de niche, sur lequel il y aura peu de contenus d’agence ou de confrères:</p>



<p>Article originel</p>



<p><a href="https://www.leparisien.fr/paris-75/monoprix-ouvre-son-premier-magasin-de-decoration-a-paris-12-07-2023-S4R3WCCWNZCLZILLSB6XOUZH3Y.php" target="_blank" rel="noopener">https://www.leparisien.fr/paris-75/monoprix-ouvre-son-premier-magasin-de-decoration-a-paris-12-07-2023-S4R3WCCWNZCLZILLSB6XOUZH3Y.php</a></p>



<p>question: Monoprix ouvre un magasin deco design&nbsp;? La réponse de You.com</p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="605" height="298" src="https://www.botscorner.fr/wp-content/uploads/2023/10/botservatoire8_youCOM_3.jpg" alt="" class="wp-image-1273" srcset="https://www.botscorner.fr/wp-content/uploads/2023/10/botservatoire8_youCOM_3.jpg 605w, https://www.botscorner.fr/wp-content/uploads/2023/10/botservatoire8_youCOM_3-300x148.jpg 300w" sizes="(max-width: 605px) 100vw, 605px" /></figure>



<p><strong>Stats sur Botscorner</strong></p>



<p><p class="MsoNormal">Les stats de you.com commencent à se remarquer, avec quelques milliers de pages par jour sur les sites branchés sur le service.</p></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="518" height="443" src="https://www.botscorner.fr/wp-content/uploads/2023/10/botservatoire8_youCOM_4.jpg" alt="" class="wp-image-1274" srcset="https://www.botscorner.fr/wp-content/uploads/2023/10/botservatoire8_youCOM_4.jpg 518w, https://www.botscorner.fr/wp-content/uploads/2023/10/botservatoire8_youCOM_4-300x257.jpg 300w" sizes="(max-width: 518px) 100vw, 518px" /></figure>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
