Les newsgroups ou forums de discussions

Plan :
1. Les NEWSGROUPS :
Introduction :
Comment à§a marche?
Sous Netscape
Sous Opera
Logiciel spécialisés
Créer un newsgroup :
Quelques Conseils quand au contenu de vos OEUVRES :
La NETETIQUETTE
2. LES ARCHIES :
Pour y accéder :
Tri des résultats :
3. Les bonnes adresses de Jean Pierre Koffe :Â Pour finir, je vais vous livrer encore quelques astuces et bonnes adresses sur le web et les moteurs de recherches :
Les Newsgroups :
Les Moteurs :Â

Introduction :
Les Newsgroups sont des forums fédérés par thèmes, oà¹, pendant une durée de temps limités, tous les courriers envoyés sont conservés et consultés par d’autres personnes qui partagent la même passion. La distinction entre les newsgroups et les listes de diffusions tient dans le fait que les documents consultés restent sur le serveur et ne sont rapatriés que si vous le désirez. On compte environ dans le monde 29000 thèmes différents de discussions. Pour y accéder, il faut utiliser des serveurs (news.emn.fr par ex mais il en existe plus de 10000) ou des services Internet qui vous proposent cette passerelle : http://www.dejanews.com, http://www.FeedMe.org ou wren.supernews.com.
Les NEWS sont hiérarchisés par grands thèmes.
Les plus répandus sont : (liste non exhaustive)
Alt (alternative) forums alternatifs, anarchiques et extrêmes (binaries, warez).
Comp (compatibles) pour les mordus d’informatiques, de logiciels, de matériels.
Misc (miscellaneaous) pour divers, un peu de tout.
sci (scientific) Recherche et applications dans les sciences exactes.
Soc (society) Problèmes de société ou culturelles dans le monde.
news Pour les administrateurs : gestions, utilisations…
talk Pour discuter…
rec (recreation) Les groupes récréation.
gnu (projet gnu) sources de logiciels modifiables gratuitement.
biz Le affaires.
Ces groupes sont fondamentaux et se retrouvent sur à peu près tous les serveurs. Comme toujours l’adresse mêmes du newsgroup peut vous renseigner sur son origine :
fr pour France, ch pour Suisse, de pour Allemagne, us…
Comment à§a marche ?
Les messages que vous envoyés sont stockés sur un disque local au serveur, tous les jours, chaque serveur compare ses articles et les échanges avec celui d’un autre, ce qui conduit à un trafic énorme sur INTERNET. L’utilisateur doit s’abonner (nous verrons plus loin comment sous NETSCAPE ou OPERA). Pour éviter des échanges inutiles d’information et surcharger encore le réseau, lors de la connexion sur un serveur, vous ne charger que les titres (Think Synthetic think mac euh pardon).
C’est ensuite à vous de confirmer le chargement du corps du message. Le protocole de gestion des NEWS est le NNTP (News Network Transfer Protocol), il s’occupe des connexions permanentes entre serveurs voisins et gère la mise à jour instantanée des articles.
Pour y avoir accès, vous pouvez soit utiliser un logiciel spécialisé soit utiliser NETSCAPE ou OPERA sur l’école. Ensuite, il faut trouver un serveur de NEWS MIRROR si possible franà§ais (penser toujours à minimiser les distances) et complet (avec le maximum de thèmes).
NETSCAPE :
Sous NETSCAPE, dans votre boite de mail, allez sous MESSAGE CENTER et sur l’icà´ne LOCAL MAIL ouvrer le menu file en haut <add new discussion server. Il faut maintenant préciser le nom du serveur de newsgroup. Taper news.emn.fr et valider. A partir de ce moment, l’adresse s’ajoute à la liste et si vous cliquer dessus avec le bouton droit et faites <open discussion group vous commencerez à charger la liste de tous les services (1 ou 2 minutes après) sur l’onglet <search a group un mini-moteur de recherche vous permet de trouver les thèmes de votre choix en utilisant le mot clés adéquat. Abonnez-vous <subscribe et <OK. A partir de ce moment, vous pourrez récupérer tous les jours comme vous le faites pour les mails la listes des sujets des articles en sélectionnant le bon folders (souvenez vous vous êtes par défaut dans INBOX) et en faisant <get mail
OPERA :
Dans le menu preferences choisir la rubrique news et définir le serveur. Puis dans le menu news cliquer sur new. C’est tout !
Si vous trouvez tout cela fastidieux et surtout si vous n’êtes pas sur un poste personnel (en fait pas au XID), je vous conseille l’utilisation d’une passerelle WEB avec ses formulaires de consultations en javascript ou en cgi-bin. Mais cela se révèle être assez lent selon l’heure de connexion.
Â

Si vous pouvez utiliser un logiciel spécialisé, les avantages sont les suivants :
– Vous pourrez lire les messages déconnectés (merci pour la facture téléphonique).
– il gère les messages en plusieurs parties qui ont été uuencodées : mais non, ce n’est pas un gros mot, certains logiciels utilisent cette technique pour acheminer les gros messages ou
 applications, il s’agit de transcrire en ascii des données binaires.
Â

Vous voulez créer un newsgroup :
Si votre proposition de création de groupe de News concerne la France c’est vers le groupe fr.news.groups qu’il faut vous orienter.
La première chose à faire, si vous ne trouvez pas réellement le groupe dont le thème vous intéresse, est de soumettre votre idée à un sondage pour voir si votre groupe ne va pas comprendre qu’un seul utilisateur : VOUS. En outre, le sondage fera peut-être apparaître, que le groupe que vous proposez de créer existe déjà , peut-être sous un autre nom que celui que vous auriez donné. Vous allez être amené à faire un CFD (Call for Discussion) et un CFV (Call For votes ) : c’est-à -dire un appel à discussion et un appel au vote. Le débat conduira au vote, et s’il intéresse suffisamment de personnes, votre groupe sera créé.

Quelques Conseils quant au contenu de vos OEUVRES :
Attention a ce que vous écrivez, votre article a peut être des chances d’être reprit dans une FAQ s’il est intéressant ou cité en référence. Pensez à structurer vos réponses et à ne pas livrer vos idées en vrac. Pour cela, utiliser les REPLY TOÂ pour répondre point par point au message et faciliter l’organisation de la structure de votre article tout en augmentant la taille de la réponse (sic). Certaines personnes utilisent des pseudo et tiennent à leur anonymat, sachez respecter les opinions de chacun.
Si votre article concerne plusieurs groupes de discussions, vous avez la possibilité de les envoyer simultanément en séparant les références par des virgules dans le champ adresse. Ne soyez pas tenté de poster vos réactions suite à des événements récents, car vos articles risquent de séjourner longtemps sur les serveurs et d’être de ce fait périmé avant d’être postée.
Avant de bafouiller un article, je suis le premier à dire qu’une bonne question amène une bonne réponse (à méditer), donc éviter de rester trop vague mais sachez ne pas être trop pointue au début, encore une fois il faut adapter son discours à l’auditoire. Faire trop de fautes par lignes (en franà§ais) gà¢che rapidement tout (j’en sais quelques chose) et en anglais faite vous corriger par un camarade ou mieux une camarade qui maîtrise mieux la langue que vous (hum…). c’est à vous de voir si vous voulez obtenir une réponse !
Le sujet est primordial, n’oublier pas que les contenus des articles ne sont pas chargés, si le sujet n’est pas intéressant, personne ne le lira ! Poser une question générique mais pas votre problème.
Mais surtout rester neutre dans le ton du message, c’est du texte et personne n’imagine votre tête lorsque vous avez écrit votre article : jeux de mots, humour, ironie sont à proscrire à tous prix.
Avant de poser une question, peut être pertinente, penser à aller jeter un coup d’Å?il à la FAQ (frequently Asked Question) pour éviter d’user la patience des acteurs du forum. Les FAQs sont mises à jour en moyenne tous les mois. Pour répondre à un article et surtout si vous ne posséder pas un logiciel dédié pour la lecture de NEWS, il faut reprendre le même titre que l’article précédé de RE: (comme respons).
Attention, NETSCAPE ne visualise que les questions, vous devez donc pour consulter la réponse cliquer sur le Thread qui lui est associé, en clair le ptit bittognot devant le titre du message.
Enfin, respecter la NETTIQUETTE, qui est un ensemble de règles tacites entre utilisateurs mais auxquelles tout le monde se conforme.
  1. Vos signatures à la fin de chaque mail ne doivent pas excéder 4 lignes (éviter graffiti ou pensées philosophiques qui surchargent le réseau) et contenir votre adresse e-mail ou postale pour permettre à une autre personne que votre sujet intéresse de vous contacter.
    2. Ne poster pas de messages personnels ou des messages à caractères tendancieux.
    3. Ne répondez pas à un article imaginaire.
    4. N’envoyer pas de messages de test sur le newsgroup, il existe des newsgroups spécifiques pour ce genre de manipulation : alt.test ou misc.
    5. Ne poster pas de publicité commerciale et sachez rester humble.
    Au pire, vous risquez de vous faire bannir du serveur ou de comprendre ce que veut dire le mot Spamming : Strictement interdit et peu à peu punissable par la loi américaine. C’est un logiciel qui envoie des milliers de mails abscons chez un utilisateur (vous) dans le but de faire exploser sa boite de mails.

LES ARCHIES :
Je vais en profiter pour vous décrire la recherche de documents par ARCHIE suite à l’engouement et aux nombreuses explications (toujours les mêmes) que j’ai du fournir lors des projets ou de l’autoformation (et qui ont peut être aussi embrouillé les esprits). En résumé, Archie recherche des fichiers et peut être interrogés par telnet ou e-mail et renvoie beaucoup moins d’informations que les moteurs de recherches WEB.

Pour y accéder :

Privilégier le courrier électronique pour ne pas attendre trop longtemps le résultat de votre requête mais vous devrez apprendre les commandes archie de bases. Il existe aussi des formulaires javascript (voir plus loin) sur le web.
En vrac voici la liste de serveur archie livrée telle quelle d’un site :
*archie.au 139.130.4.6 (Australie) *archie.edvz.uni-linz.ac.at 140.78.3.8 (Autriche) *archie.univie.ac.at 131.130.1.23 (Autriche) *archie.cs.mcgill.ca 132.206.51.250 (Canada) *archie.funet.fi 128.214.6.102 (Finlande) *archie.univ-rennes1.fr 129.20.128.38 (France) *archie.th-darmstadt.de130.83.128.118 (Allemagne) *archie.ac.il 132.65.16.18 (Israà«l) *archie.unipi.it 131.114.21.10 (Italie) *archie.wide.ad.jp 133.4.3.6 (Japon) *archie.hama.nm.kr 128.134.1.1 (Corée) *archie.sogang.ac.kr 163.239.1.11 (Corée) *archie.uninett.no 128.39.2.20 (Norway) *archie.rediris.es 130.206.1.2 (Espagne) *archie.luth.se 130.240.12.30 (Suède) *archie.switch.ch 130.59.1.40 (Suisse) *archie.nctuccca.edu.tw (Taiwan) *archie.ncu.edu.tw 192.83.166.12 (Taiwan) *archie.doc.ic.ac.uk 146.169.11.3 (Royaume Unis) *archie.hensa.ac.uk 129.12.21.25 (Royaume Unis) *archie.unl.edu 129.93.1.14 (USA ) *archie.internic.net 198.49.45.10 (USA) *archie.rutgers.edu 128.6.18.15 (USA) *archie.ans.net 147.225.1.10 (USA) *archie.sura.net 128.167.254.179 (USA) *archie.belnet.be 193.190.198.2 (Belgique)
Par le web on trouve à§a :
http://www.lerc.nasa.gov/archieplex/doc/form.html (limité)
Par Telnet
Trop compliqué.

Par le courrier électronique
La plus avantageuse car cela vous permet de vous déconnecter.
L’adresse est de type : archie@nom.du.serveur.
Ex archie@archie.univ-rennes1.fr
Moi, je préfère personnellement les moteurs de sites ftp comme :
http://www.filez.com
http://ftpsearch.ntnu.no/ftpsearch
ou encore http://www.dogpile.com

Tri des résultats :
Je vais en profiter pour clarifier du même coup la recherche avec le logiciel ftpsearch (voir dernier echo) et faire comme on dit, d’une pierre deux coup.
(sort by) : C’est l’ensemble des filtres qui sont à votre disposition : Vous pouvez opérer le trie des résultats de la recherche par date ou par serveur vous répondant
Case Insensitive Substring Match : permet d’obtenir tous les noms de fichiers qui contiennent la sous-chaîne de caractères que vous cherchez. Attention si archie ne fait pas la distinction entre les minuscules et les majuscules, ftpsearch le fait.
Exact Match : permet d’obtenir tous les noms de fichiers qui contiennent exactement la chaîne de caractères que vous cherchez. C’est la méthode à utiliser si vous connaissez le nom de fichier exact que vous cherchez car elle est la plus rapide.
Case Sensitive Substring Match : permet d’obtenir tous les noms de fichiers qui contiennent la sous-chaîne de caractères que vous cherchez.
Regular Expression Match : permet de rentrer dans le nom du fichier recherché une expression régulière, ceci donne des critères de recherche plus puissants mais plus complexes.
Â

Les bonnes adresses :
Pour finir, je vais vous livrer encore quelques astuces et bonnes adresses sur le web et les moteurs de recherches :

Les Newsgroups :
– news.answers [news:news.answers] Ce groupe contient les News les plus célèbres. C’est le groupe le plus important et pas forcément le plus connu. Si vous avez besoin d’une information sur un sujet donné et si vous trouvez sa FAQ ici, vous aurez un survol de toutes les questions que vous êtes en droit de vous poser sur le sujet.
– Le groupe o๠l’on trouve l’ensemble des FAQ franà§aises est fr.news.reponses news :fr.news.reponses
– alt.internet.services [news:alt.internet.services] Si vous désirez savoir quelque chose de précis sur Internet c’est ici qu’il faut poser sa question.
http://www.fr.net/news-fr/liste.html vous y trouverez la liste des news franà§ais.
www.tne.net.au/kytek/freenews.html
wren.supernews.com : offre une passerelle web a tous les newsgroups (y compris les ALT)
Certains services Internet archivent les news pendant quelques temps :
Loria www.loria.fr/news pour les groupes franà§ais ou
DejaNews (www.dejanews.com) pour tous les groupes internationaux
Pour partir à la recherche de FAQ, Je vous donne deux pistes :
A l’université d’Ohio www.cis.ohio-state.edu/hypertext/faq/usenet/top.html
Les faq franà§aises : www.eerie.fr/~news/faq-fr/

Les Moteurs :
– Un service qui vous informe lorsque votre page préféré est modifié :
http://www.netmind.com/html/register.html
– Un moteur de recherche sur les Mailing-list : www.liszt.com
– Les dépêches de presse : nt.excite.com
– Pour trouver un moteur de recherche hyper pointue sur un domaine particulier (900 thèmes) : www.beaucoup.com/engbig.html
– LA nouvelle mode : les METAMOTEURS , qui combinent plusieurs bases de données et éliminent les doublons :
  www.cyber411.com
  profusion.ctlc.ukans.edu
  http://www.nlsearch.com
– Vous manquez d’idées devant votre moteur de recherche ? Un peu blasé par la pléthore de documents ou de sujets ?
voyeur.mckinley.com/cgi-bin/voyeur.cgi vous dit toutes les 15 secondes ce que les autres cherchent !!!! jpg, jpg, jpg
– Pour vous cacher et surfer en anonyme ou envoyer des mails :
 www.anonymizer.com ou www.iproxy.com
idéal, pour cacher son ip ou récupérez pgp.
– Pour atteindre las bases de données protégées par mots de passe www.internets.com
– Presque tous les moteurs acceptent le caractère “*”, en tapant les trois premières lettres d’un mot, le moteur complète pour vous, Pratique si vous oubliez l’orthographe d’un mot.
– L’astuce définitive pour s’y retrouver sur le site bordélique et peu convivial de Microsoft (www.microsoft.com) cliquer sur ftp://ftp.microsoft.com/softlib/.
et récupérer le fichier index.txt qui contient les références de 2500 fichiers du site qui est remis à jour quotidiennement.

Les Boards ou forums Web

 Ce type de technologie est très à la mode sur le Net (mais qu’est ce qui ne l’est pas, me direz-vous ?). Cela ressemble à un newsgroup mais cela n’est géré que par une seule personne et le forum est localisé à une seule adresse : Pas de protocole NNTP donc mais un script CGI ou #Java qui archive les messages, autorise le post et la gestion des messages. On en compte environ 10000 et ce chiffre ne cesse d’augmenter. On peut expliquer ce succès par le fait que des logiciels de gestion de Bord gratuit existent et par la simplicité de mise en place du système.

Les Links ou liens

 Je me devais de parler aussi de ce mode de recherche, même si il tombe sous le sens pour certains, cela ne peut être un automatisme pour d'autres : Pensez à visiter les pages de liens des documents que le moteur de recherche vous fournit. En effet, puisque que quelqu'un a déjà navigué, filtré et trié les sites pour vous, autant en profiter et gagner ainsi du temps.

Les Mailings-List ou bulletin d´informations

Il s’agit de bulletins d’informations à parution plus ou moins régulière émis par des organismes ou des individus et dont le but est de fournir un ensemble de messages traitant d’un sujet particulier. Il en existe plusieurs centaines Francophones et quelques milliers américains. Certaines Mailings-List sont ultra confidentielles et regroupe quelques personnes voire aucunes tandis que d’autres possèdent des millions d’abonnés. Pour consulter ce type de sources, il faut vous abonner : envoyer un mail contenant le mot "subscribe" à l’adresse que vous trouverez et qui est du type :nom_du_robot@nom_domaine. C’est automatique et totalement gratuit. Pour mettre fin à l’abonnement, il suffit de recommencer avec cette fois-ci le mot "unsubscribe". Tous les jours, vous recevrez un nombre indéterminé de mails de la part du robot automatique.Les problèmes que pose ce mode de recherche sont surtout la véracité des informations et donc le crédits que vous pouvez y apporter d’une part, et la quantité astronomique de mail qui risquent de faire saturer votre boite aux lettres d’autres part.Pour créer votre propre mailing-list, et donc ainsi pouvoir bénéficier d’un moyen facile de contacter vos collaborateurs, clients, fournisseurs, anciens élèves, je vous recommande :www.sorengo.com/sorengo/direct gratuit sauf pour l’archivage de vos anciens messages 10fr/mois/Mo.www.poplist.net ou www.listz.com pour la recherche des précieuses adresses.Cela reste encore un mode de recherche aléatoire, car vous ne pourrez jamais deviner ce qui va être écris si vous ne participer pas, il faut donc être actif.

On trouvera (florilège) :

http://www./lmb.cnrs.fr/webdo.html Lmb actu 5000 abonnés, maintenus par une agence de presse pour le CNRS, c’est le 1 er bulletin d’information français sur les technologies Internet et sur la technologie en général. Il offre une bonne synthèsehttp://www.cru.fr/listes/sciences.html (nom de la liste : stpress@cru.fr)StPress pour pratiquer la veille technologique au USA mais attention au niveau requis pour pouvoir séparer l’utile de l’inutile.humour:http://www.domus.tm.fr/blague/http://www.sorengo.com/sorengo/direct/ (nom la liste rigoler@sorengo.com) Continue reading Les Mailings-List ou bulletin d´informations

Les WebRings ou anneaux

 Ce concept vous permet de trouver tous les sites parlant d'un même domaine, de retrouver tous les pages de passionnés qui se sont référencés dans une communauté webring. On compte quelques milliers d'anneaux virtuels (en augmentation) qui traite de tous les domaines. Vous avez (lorsque vous en trouvez un) la possibilité de vous balader aléatoirement ou en sautant de site en site. La qualité reste disparate et n'est pas toujours au rendez-vous mais vous n'aurez aucun risque de manquer un site potentiellement intéressant. La recherche reste néanmoins fastidieuse.

une seule adresse pour créer des anneaux ou y accéder via un moteur de recherche : www.webring.org

La Recherche de Documents sur Internet.

 Ou l'art et la manière de rechercher et d'accéder aux bases
de données HTML, FTP et NEWSGROUPS avec des moteurs de recherche.

Introduction
Internet est sans aucun doute la plus fantastique base de donnée du monde voire n'ayons pas peur des mots, de notre univers. Naviguer ou surfer sur cet océan numérique de données passe par l'utilisation adéquate des moteurs de recherche.

Historique
Internet est un réseau à la base militaire (humour), dans les années 70, le gouvernement américain a senti le besoin de posséder un réseau informatique. Sa topologie (structure maillée) permet en cas de destruction d'un poste ou nœud de toujours permettre l'acheminement des données. Cette caractéristique est un avantage mais aussi un inconvénient pour nous : Les adresses Internet sont ésotériques à l'images des url (universal ressource locator = ad d'un service, d'un objet sur Internet) ex http://worldcom.ch/~jbricod/maintemp/whz087/index.htm et bien souvent dynamique.

Quelques précisions sur les adresses
En fait, une adresse, c'est aussi un numéro IP unique codé sur 32 bits et organisés en domaine (masqué par les serveurs DNS). Lors
1 adresse URL = nom@organisation.domaine
  • com désigne les entreprises commerciales,
  • edu désigne l'éducation,
  • gov désigne les organismes gouvernementaux,
  • mil désigne les organisations militaires,
  • net désigne les organismes fournisseurs d'Internet,
  • org désigne les autres organismes non référencés.
Ils sont aussi regroupés en pays :
nom@organisation.domaine sont des adresses dites FQDN (Fully Qualified Domain Name)
ex : chirac@elysee.fr est un français (fr), il travaille à l'Elysée et son nom est Chirac.
Les accents sont interdits car interprété différemment suivant les systèmes d'exploitations.
Les adresses IP

РNum̩ro de 32 bits, 4 nombres s̩par̩s par trois points.
Рc'est un num̩ro unique ! ! !
Par ex, 292.203.245.63
РC'est un organisme le NIC (Network Information Center) qui fournit les premiers num̩ros appel̩s racine du num̩ro IP
РUne adresse FQDN passe dans un DNS locale au domaine qui la transforme en num̩ro IP.

Moteur de recherche
Un moteur de recherche n'est rien d'autre qu'un processus automatisé qui indexe des millions de pages HTML. Pour cela, il recopie l'adresse (url) et la description de la page contenu dans la section meta content, si elle existe, dans une base de donnée.
Exemple de fichier HTML avec une section complétée :
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="Author" CONTENT="Cedric WALTER">
<META NAME="GENERATOR" CONTENT="Mozilla/4.05 [en] (X11; I; #Linux 2.0.18 i686) [Netscape]">
<TITLE>The non Official Meta Kernel home page</TITLE>
<META NAME="keywords" CONTENT="metakernel,hp48,MDG,kernel">

Voilà les mots qu'indexe le moteur de recherche.

<META NAME="description" CONTENT="The non Official Meta Kernel HOMEPAGE provide every tools you can find on internet to deal with this incredible and convenient tool developped by the MDG team.">

Et la description qui correspond au contenu du site.

</HEAD>
<BODY TEXT="#000000" BGCOLOR="#FFFFFF" LINK="#0000EF" VLINK="#51188E" ALINK="#FF0000" BACKGROUND="images/background.gif" NOSAVE>

Vous pouvez alors, interroger cette base de donnée à distance. Petit à petit, on à chercher à affiner la requête avec des mots clefs ou des caractères de contrôle car rechercher un document ne contenant qu'un mot fournirai trop de réponses. Les plus courants sont les suivants et se sont peu à peu imposés comme un standard :

+ ou AND : rechercher un document contenant l'association de 2 ou plusieurs mots. Ex: essaim+mulhouse équivalent à essaim and mulhouse
OR : le ou logique. Ex: essaim or ensitm.
( ) Parenthèses : ex : (essaim or ensitm) and mulhouse.
NOT : Non logique, négation. Ex: essaim + not ensitm (désolé).
NEAR : Opérateur de proximité, recherche dans un document l'association de 2 mots séparés de n mots en avant ou en arrière. (n=10 ou 20 en générale).
Ex : essaim near mulhouse.

La combinaison plus ou moins heureuse de ces opérateurs logiques permet d'éliminer beaucoup de documents sans intérêts. Néanmoins, il existe une règle absolue : les moteurs font la différence entre majuscules et minuscules, ainsi essaim est différent de ESSAIM (vous suivez). La convention suivante à été fixé : si des majuscules sont contenues dans une requête, alors seuls les documents contenant ces mots seront retournés.
ESSAIM – uniquement les documents avec le mot ESSAIM en majuscules.
Essaim – tous les documents contenant ce mot.
Les guillemets permettent de spécifier une trame de caractères :
"essaim : école supérieure des". Les moteurs de recherche sont nombreux et varié : certains sont spécialisés dans un domaine, d'autres sont plus généralistes, indexe plus ou moins de documents, sont bilingues….etc. Essayer de les recenser ou tous les utiliser est utopique. Il suffit d'en maîtriser deux ou trois pour trouver ce que l'on cherche. Il ne faut pas non plus se leurrer, car sans l'emploi de mots clefs anglais indispensables, point de salut. Il faut absolument acquérir le domaine sémantique de l'objet de votre recherche.
Pour ma part, j'utilise HOTBOT (www.hotbot.com) pour la pertinence de ses réponses et son pourcentage de corrélation sur les réponses. Grâce à lui, je n'ai jamais eu à visualiser plus de la première page pour trouver le document qui m'intéresse. Cela doit s'expliquer en partie par les options de formatage des réponses par défaut.
ALTAVISTA (www.altavista.com) est rapide et paramétrable (peu être un peu trop pour le novice), les réponses fournit sont déroutantes et affichées dans le désordre ( eh oui faut paramètrer). En conséquence, il faut savoir investir un peu de temps avant d'en apprécier sa puissance.
EXCITE ou ECILA ou YAHOO (www.excite.com, http://www.ecila.com et http://www.yahoo.com) font référence en majorité à des pages francophones, et si l'anglais n'est pas votre tasse de thé (sic), remettez-vous à leur service dans un premier temps. La tendance actuelle sur Internet est de proposer des services qui interroge à votre place les principaux moteurs de recherche, citons http://www.metacrawler.com et http://www.dogpile.com. Les réponses de chaque moteur sont retournées sur la même page mais les réponses sont peu nombreuses et à mon avis incomplètes. Pour vous faciliter la vie, j'ai concentré sur une même page, une trentaine de ces moteurs. L'intérêt est double : une seule adresse à connaître et un gain de rapidité. Pour trouver des documents, je vous conseille deux approches :

* Soyez généralistes dans votre demande puis affiner successivement la requête avec les opérateurs logiques.
* Attaquez franchement : formuler votre demande entre guillemets, mais il vous faudra beaucoup de chance ou d'expérience (vont-il vraiment de paire.).

Pour finir cette partie, je vais jouer à un petit questions réponses :
Pourquoi ne suis pas référencé lorsque je recherche ma page Internet ?
Il y a 2 cas : Soit le robot ne vous a pas encore trouvé (Altavista met 4 semaines pour faire le tour d'Internet) et dans ce cas, chaque page d'accueil des moteurs vous proposent de forcer cette indexation (ADD URL), soit vous n'avez pas rempli le champ content des documents HTML, il vous faut alors éditer chaque fichier et le compléter avec votre description (concise).
Je recherche une sélection de documents dans un domaine particulier ?
Yahoo offre ce service.
Je recherche une adresse e-mail ?
Désolé, il n'existe pas de normalisation au niveau mondial pour ce type de requête (essayer néanmoins http://www.four11.com). Seule les personnes ayant accédé au newsgroups ou s'étant références ont une e-mail accessible sous yahoo. Voici une astuce : si vous cherchez quelqu'un dans une école ou une organisation, essayer de trouver une page HTML ou un e-mail du même domaine et substituer le nom de la personne en observant la grammaire :
ex : C.Walter@essaim.univ-mulhouse.fr (il est facile de compléter par un autre nom)
Les différences entre les moteurs:
+- généralistes ou spécialisés,
– Certains sont bilingues, (yahoo)
– Configurable
– Indexe plus ou moins de documents, (altavista, hotbot)
РLe temps de r̩ponse, (altavista)
РLa qualit̩ des r̩ponses, (hotbot)

      LA RECHERCHE DE FICHIERS

Cette fois ci, on recherche des fichiers, documents, jeux, sharewares…etc.
Le protocole de transfert de fichiers est le FTP (File Transfert Protocol) et sert donc à interconnecter deux machines distantes (généralement une distante et la votre, locale). L'outil change et se nomme FTP, CUTE-FTP, FTP VOYAGER… voire NETSCAPE ou IE (mais ce n'est pas leur fonction première). Sur Internet, on vous propose de télécharger un fichier, vous aller utiliser le FTP sans le savoir, vous le faites depuis longtemps et sans mon aide et pourtant essayer l'URL suivante : http://ftpsearch.ntnu.no/ftpsearch. C'est un moteur de recherche ftp néerlandais qui référence plus de 60 millions de fichiers. En FTP, aussi on cherche à minimiser la distance qui sépare les deux machines, alors si le débit n'est pas extraordinaire, pourquoi ne pas lancer un FTPSEARCH et charger le même fichier (même nom, même taille) sur un MIRROR allemand ou français ?

  • FTP (File Transfer Protocol) = échanger des fichiers sur Internet ou TCP/IP. Machine Locale <-> Machine Distante
  • En utilisant FTP, vous serez clients d'un modèle client/serveur et vous vous adresserez à un serveur de fichier par ftp.
  • Un compte + un mot de passe mais le compte anonymous+ un Email qq existe toujours.
  • Adresse du serveur du type:
    ftp.nom.domaine[chemin/[fichier]] si logiciels
    ftp://ftp.nom.domaine si browser
  • Logiciels: FTP, CUTE-FTP, FTP VOYAGER…voire NETSCAPE ou IE
  • En général sous la racine du site: README ou INDEX indiquent les fichiers disponibles, avec un commentaire sur chacun d'eux.
  • Si ça râme, allez sur un site miroir, c'est-à -dire un site contenant les mêmes informations, mais à une autre adresse.
    Essayer : http://ftpsearch.ntnu.no/ftpsearch ou www.filemirrors.com
  • Netiquette:
    Heures de transfert : (respecter les heures du pays ! !)
    Matin -> Usa
    Nuit -> France
    Le W-End tout est permis.
  • Les commandes en mode console:
    Ls : liste contenu disque distant.
    Lcd : local change directory
    Put , mput : envoyer 1/des fichier(s)
    Get , Mget : copier 1/des fichier(s)
    Prompt : mode interactif
    Binary.

       LES NEWSGROUPS ou forums de discussions.

C'est sans conteste l'outil le plus performant, imaginer 29000 thèmes de discussions dans le monde, ou se rencontre des chercheurs, passionnés et novices qui ne veulent que faire avancer le schmimblick dans un domaine. C'est l'endroit idéal pour récupérer une FAQ (Frequently Asked Questions), vous savez toutes ses questions quelque fois idiotes mais qui reviennent tout le temps. Encore une fois, nous devons subir la mauvaise réputation des forums ALT (comme alternatives) aux sujets extrêmes, c'est pour cette raison que l'université n'est pas abonnée. Cependant, si un domaine vous intéresse : synthèse, informatique, astronomie, le retour d'Elvis, la secte des bananes cuites au four… que sais-je. Vous pourrez rentrer en contact avec tous les acteurs d'un domaine particulier grâce au site MIRROR (ouf !) : News.emn.fr ou news.jussieu.ext.fr mais sans la possibilité d'apporter votre contribution, ce qui est dommage ( je cherche encore). Pour y accéder, sous NETSCAPE, ouvrer "collabra center" et "add news servers" avec le bouton droit puis "open discussion server". Abonnez-vous (subscribe) mais en pensant que s'abonner à un newsgroup, c'est recevoir à chaque connexion 200 mails ou plus par jour : attention à la saturation du disque.

Walter Cédric, Le Cobaye.
Â