OWNI http://owni.fr News, Augmented Tue, 17 Sep 2013 12:04:49 +0000 http://wordpress.org/?v=2.9.2 fr hourly 1 L’enfer du lol http://owni.fr/2012/11/12/l-enfer-du-lol/ http://owni.fr/2012/11/12/l-enfer-du-lol/#comments Mon, 12 Nov 2012 10:06:06 +0000 Andréa Fradin http://owni.fr/?p=125680

“- L’album de Charlotte Gainsbourg est la grâce quintessenciée – Je suis tellement d’accord avec toi !” Ah ils sont nombreux ces moments gênants sur Internet ! Ces discussions qui dérapent malgré nous pour cause de sarcasme trop crédible ou à l’inverse pas assez grossier pour être détecté.

En ligne, personne ne vous entend rire. Ou ne voit la malice scintiller au fond de vos yeux au moment de balancer une vanne pincée. Résultat : Internet est une grosse mare dans laquelle les quiproquos s’enfoncent comme de gros pavés.

Au-delà des petits ajustement relationnels imposés par le sarcasme incompris (“hihi, mais je plaisantais pour Charlotte, mais les goûts, les couleurs ;D”), ce dernier pose des problèmes autrement plus conséquents. Notamment auprès de la communauté des linguistes, experts en informatique et autre spécialistes désireux de déchiffrer tous nos messages laissés sur Facebook et Twitter – pour ne citer que les gros.

C’est la “science étrange de la traduction du sarcasme en ligne” écrit le Wall Street Journal dans un article paru fin octobre.

Par définition, ce genre de plaisanterie dit “le contraire de ce qu’on veut vraiment dire”, poursuit la journaliste. Le sarcasme s’avère donc “être un obstacle pour les chercheurs et les spécialistes en marketing qui créent des programmes informatiques pour analyser les importantes réserves de bavardages en ligne pour mesurer l’opinion publique sur des produits ou des politiciens.”

L’humour en ligne comme pare-feu aux dernières trouvailles du marketing “digital”. Comme antidote à la récolte des données que l’on laisse sur les services a priori gratuits du web. Qui s’en servent en retour comme potentielle machine à cash. Troll ultime : 4chan n’aurait pas fait mieux.

Alors bien sûr, des stratégies existent pour déceler la malice. En particulier les smileys, ou émoticônes, ces petits visages de travers, avec ou sans nez, si pratiques pour se rendre clairs. Ou désamorcer une situation embarrassante (cf. supra).

Mais le smiley ne suffit pas. Kate Paulin, responsable dans une agence marketing et interrogé par le WSJ, est formelle. “Travailler pour des marques telles que Coca-Cola lui a appris qu’il ne faut pas se fier aux apparences d’un smiley”, détaille le journal. Qui ajoute :

Ados et twittos utilisent des émoticônes de manière sarcastique, à l’en croire. Et un simple point d’exclamation – contrairement à plusieurs – peut en fait traduire un manque d’enthousiasme.

Les ravages de l’humour en ligne sont plus grands encore. Ils se constatent jusque dans les labo de recherche, où l’on s’arrache les cheveux à systématiser la compréhension des double, triple sens des tweets et posts. “Le sarcasme est l’un des problèmes les plus difficiles en informatique”, confie ainsi un professeur d’une université californienne, qui conduit un programme d’analyse des “sentiments” exprimés sur les réseaux sociaux. Ce qui fait dire au Wall Street Journal :

Les programmes informatiques suivent des règles strictes, alors que le langage naturel, en particulier la culture ‘private joke’ du web, non.

Mais les casse-têtes des uns font le bonheur des autres. Ou presque. Pour certains, comme Doug Sak, cette absence de signalétique sarcastique est une mine d’or. Il y a 10 ans, il a créé “SarcMark”, une sorte de spirale avec un point au milieu, qu’il souhaite imposer comme marqueur universel du sarcasme. A en croire le Wall Street Journal, il aurait même contacté plusieurs opérateurs pour imposer son sigle dans les claviers des téléphones.

Contacté par Owni pour en savoir plus, Doug Sak ne nous a toujours pas répondu. Il semblerait néanmoins que le succès se fasse attendre. Mais l’homme d’affaire garde espoir. Et son sens de l’humour : “je ne sauve pas le monde mais cela a un véritable intérêt”. Du sarcasme, évidemment.



Et pour toujours plus de sarcasmes, allez lire les commentaires (en anglais) de l’article original !

Photo par Djniks [CC-byncsa]

]]>
http://owni.fr/2012/11/12/l-enfer-du-lol/feed/ 0
La reconnaissance vocale est morte : pet à son âme http://owni.fr/2010/11/10/la-reconnaissance-vocale-est-morte-pet-a-son-ame/ http://owni.fr/2010/11/10/la-reconnaissance-vocale-est-morte-pet-a-son-ame/#comments Wed, 10 Nov 2010 15:04:45 +0000 Dr Goulu http://owni.fr/?p=33275 D’après “2001 l’Odyssée de l’Espace”, nos ordinateurs devraient comprendre notre voix depuis 9 ans. Depuis 1997, on trouve des logiciels de reconnaissance vocale pour PC, et depuis peu nos téléphones disposent de cette fonction. Mais on ne l’utilise pas. Je ne connais personne qui dicte ses e-mails, et vous ?

Comme tous les geeks j’ai essayé de temps en temps, parfois passé une heure à lire des textes d’apprentissage de la voix la plus monocorde possible à la nouvelle version d’un soft, et puis abandonné devant ses piètres performances. Ça ne marche pas, ou pas assez bien.

Robert Portner analyse cet échec dans ”Rest in Peas: The Unrecognized Death of Speech Recognition“, titre subtilement traduit en français dans le présent article.

Le problème, c’est qu’après une phase de progrès rapides à la fin du siècle passé, le taux d’erreur de mots plafonne à 10% depuis 2001, soit environ le triple du taux d’erreur d’un être humain. Et encore, c’est pour l’anglais “standard”. Le taux d’erreur est bien plus élevé pour d’autres langues, et catastrophique pour une conversation entre supporters de foot à la sortie du match. (Voir l’évolution du taux d’erreur de mots du National Institute of Standards and Technology).

Pourtant dans les années 1990, des systèmes très fiables avaient été mis au point pour distinguer quelques mots bien choisis dans des cockpits d’avion ou des chiffres au téléphone, et on s’était légitimement attendus à ce que la Loi de Moore permette de traiter rapidement le langage naturel.

Et effectivement, aujourd’hui on sait bien reconnaitre des mots isolés. On sait à peu près éliminer les absurdités non conformes à la grammaire dans des phrases simples comme “le chat ment je la sous rit.” Mais pour distinguer entre “le chas mange la souris”, ”le chat mange là, sous l’riz” et  ”le chaman gela, sourit” et , il faut comprendre le sens de la phrase, voire le contexte dans lequel elle est prononcée…

Si l’ordinateur doit connaitre la différence entre un quadrupède carnivore et le trou d’une aiguille pour traiter une phrase triviale, on imagine que ce n’est pas demain qu’on dictera des contrats* ou des rapports à une machine.  De gros projets ont été lancés par des poids lourds de l’informatique pour tenter de modéliser la connaissance humaine.

Par exemple le projet MindNet de Microsoft a analysé des millions de pages de textes existants pour construire un graphe sémantique gigantesque, duquel il ressort effectivement que dans une phrase comportant “chat” et “souris”, le plus probable est que le chat chasse la souris. Un tel graphe peut certainement être utile en traduction automatique car on dispose d’un texte de départ, mais pour la reconnaissance vocale il faudrait étendre le graphe à la structure des phrases utilisées en conversation courante, qui peut être bien distincte du langage écrit. Et pour faire ça automatiquement, il faudrait la reconnaissance vocale…

Comme le note Portner, on pensait au début que la reconnaissance vocale était un premiers pas vers l’intelligence artificielle. Aujourd’hui de nombreux chercheurs estiment que l’intelligence artificielle est indispensable pour atteindre une reconnaissance vocale de qualité acceptable. Les gros projets de recherche ont été abandonnés les uns après les autres, bloqués devant le mur si bien décrit par les Perlisismes sur l’intelligence artificielle comme :

“Une année de travail sur l’intelligence artificielle est suffisante pour vous faire croire en Dieu”

Le nombre de recherches sur “reconnaissance vocale” ou “Dragon Naturally Speaking” sur Google baisse régulièrement depuis 2001. Comme aucune  idée fondamentalement nouvelle ne vient relancer la recherche, la reconnaissance vocale est morte, en toute discrétion.

Note : Ça me rappelle l’histoire de la secrétaire d’un célèbre ingénieur de la génération dictaphone qui avait commandé “310 mètres d’isolation entre 2 étages” au lieu de “3 centimètres” . Ça c’est avec les 2% d’erreurs de transcription humaines…

>> Article publié initialement sur le blog de Dr Goulu

>> Illustrations FlickR CC : TruShu et Loguy en CC pour OWNIsciences

]]>
http://owni.fr/2010/11/10/la-reconnaissance-vocale-est-morte-pet-a-son-ame/feed/ 6
Comment lisons-nous les photographies ? http://owni.fr/2010/02/26/comment-lisons-nous-les-photographies/ http://owni.fr/2010/02/26/comment-lisons-nous-les-photographies/#comments Fri, 26 Feb 2010 17:30:23 +0000 André Gunthert http://owni.fr/?p=9103 IMG_8376

Le magazine Le Chasseur d’images propose une rubrique régulière de critique des photos envoyées par les lecteurs, intitulée “L’Album des lecteurs”. Le journal ajoute quelques indications techniques, notamment l’appareil utilisé. Entretenu sur la durée, un tel échantillon constitue un corpus précieux pour étudier l’évolution de la pratique des “amateurs experts”.

Mais les appréciations rédigées par la rédaction peuvent elles aussi apporter d’utiles enseignements. Composée d’une quinzaine de photographies qui sont autant de “cas”, la sélection publiée suscite logiquement un commentaire élogieux. Mais celui-ci est systématiquement balancé par une critique, dont l’expression est justifiée par le caractère pédagogique de la rubrique. Le rédacteur, photographe professionnel, gratifie l’amateur – et les lecteurs du journal – d’une leçon d’autant plus efficace qu’elle s’effectue par l’exemple.

Dans le numéro de mars 2010, nous pouvons ainsi découvrir le commentaire suivant d’une photographie envoyée par Patrick Barbazan: «Certes, ces trois dos tournés et leurs tresses blondes ne manquent pas d’intérêt. Mais comme votre courrier ne donne aucune explication sur la photo, on se demande ce que vous voulez montrer. Avec cette profondeur de champ, vous accréditez l’idée que les enfants sont en admiration devant le monument. Si vous vouliez donner l’impression d’une bouderie à l’égard du photographe, il fallait que seuls les enfants soient nets» (p. 163).

Patrick Barbazan n’a pas joué le jeu. Sa photographie, réalisée au Nikon Coolpix 4300, ne porte aucune précision de titre qui permettrait à l’observateur de situer une circonstance, et donc de préciser la signification de l’image. Réduit au jeu des devinettes, Guy-Michel Cogné suggère une interprétation de l’image comme mise en scène d’une “bouderie à l’égard du photographe”, qui le conduit à critiquer une profondeur de champ trop importante.

J’aime bien cette image, sa composition comme son caractère énigmatique. Face à cette photographie, je ne peux m’empêcher de me livrer à mon tour une tentative de décodage. L’absence de titre comme l’appareil utilisé m’aiguillent vers une prise de vue familiale qui a dévié, plutôt que vers une mise en scène soigneusement préparée. J’imagine l’occasion d’une photographie de groupe, modifiée de façon impromptue lorsque l’auteur remarque que les fillettes portent toutes trois une coiffure similaire. Il s’agirait alors d’un “portrait avec tresses”, dont la spontanéité relative est compatible avec la profondeur de champ ordinaire d’un compact à petit capteur.

Peu importe que cette interprétation soit ou non la bonne. Dans la plupart des cas de photographie familiale, il n’y a pas “une” signification définitivement stabilisée, mais plutôt une ouverture à des lectures diverses, construites a posteriori à partir des contextes d’usage des images. Ce qui est important, c’est que j’ai besoin d’une option de lecture: je ne peux pas apprécier cette photographie indépendamment de l’interprétation qui lui donne sens, et qui revient en dernière instance à identifier l’intention de l’auteur.

Se proposant d’établir la définition sociale de la photographie, Pierre Bourdieu avait lui aussi collecté une série de réactions interprétatives (malheureusement déconnectées des images sources) auprès de ses témoins: «Une mèche de cheveux, une chevelure, elle est jolie, celle-là aussi; elle est loupée, c’est fait exprès; il a joué sur les défauts pour ne laisser voir que les cheveux. Un tour de force, ça! C’est un artiste qui a fait ça?» «Une chose qui manque, c’est d’avoir fait de la photo. On ne peut pas savoir ce qui est loupé» (Un art moyen, Minuit, 1965, p. 131).

Selon Bourdieu, en cherchant ce que la photographie devait signifier, ces commentaires manifestent un «goût barbare». «La lisibilité de l’image elle-même, explique-t-il, est fonction de la lisibilité de son intention (ou de sa fonction).» En observant que «l’attente du titre ou de légende qui déclare l’intention signifiante» est le seul critère permettant «de juger si la réalisation est conforme à l’ambition explicite», le sociologue porte un regard sévère sur cette esthétique populaire, incapable de s’élever vers une perception non strictement fonctionnelle.

En réalité, notre appréciation d’une œuvre d’art n’est pas moins tributaire de la connaissance des intentions de l’auteur. La principale différence est que le contexte indiqué par les conditions d’exposition diminue largement l’incertitude sur ce caractère. Ce que trahit le retour insistant de la question de l’intention dans l’interprétation photographique n’est pas le caractère conventionnel de la prise de vue, mais au contraire une ouverture trop importante du spectre des possibles – non pas un signifié rabattu de force sur le signifiant, mais au contraire un caractère flottant de la signification.

Que nous montrent ces trois paires de tresses? Des enfants absorbées dans l’observation d’une vieille batisse – photo de reportage? La “bouderie à l’égard du photographe” – mise en scène volontaire? Un portrait à l’envers de trois coiffures semblables – impromptu formaliste? Ou encore aucune de ces trois lectures? En l’absence de légende, il est impossible de trancher, et il n’est même pas certain qu’une intention univoque ait préexisté à la lecture de l’image.

Contrairement au message linguistique, élaboré afin de réduire l’ambiguïté de la communication, l’image ne relève pas d’un système de codes normalisés qu’il suffirait d’appliquer pour en déduire le sens. Comme celle d’une situation naturelle, sa signification est toute entière construite par l’exercice de lecture, en fonction des informations de contexte disponibles et des relations entre eux des divers éléments interprétables.

Un aspect révélateur de la nature du signe linguistique est sa traductibilité. C’est parce qu’il repose sur un ensemble de codes externes – alphabet, vocabulaire, grammaire – qu’un message peut être traduit d’une langue à l’autre. La lisibilité d’une image s’appuie au contraire sur l’universalité de la perception visuelle – et simultanément sur le capital culturel individuel de l’observateur. Ce qui explique qu’il puisse y avoir plusieurs lectures d’une image, alors même que celle-ci ne peut faire l’objet d’une traduction au sens strict.

C’est parce l’image n’est pas un signe (au sens où celui-ci représente l’unité identifiable d’un système normalisé) qu’elle présente un degré élevé d’ambiguïté – ce que nous appelons souvent “polysémie” de l’image. Réduire cette ambiguïté est la condition de la reconnaissance d’une signification. En l’absence d’un titre ou d’une légende suffisamment explicite, l’identification de l’intention de l’auteur fournit apparemment la clé la plus efficace de ce processus.

» Article initialement publié sur Culture Visuelle

]]>
http://owni.fr/2010/02/26/comment-lisons-nous-les-photographies/feed/ 1