ACCUEIL > Sciences Ouest > Année 2005 > 225 > Dossier du mois : Les 30 ans de l'Irisa > Informatique et étiquettes
Informatique et étiquettes
La sécurité, une priorité
La conception logicielle
De la thèse à l'emploi
L'Irisa, l'Europe et l'industrie
Le projet Evodia
Embarquer du Java
Médecine et informatique
Grilles informatiques
L'Irisa en France
Le parcours d'Ivan Laptev
Des échanges à travers le monde
Les coulisses informatiques

 

Une recherche à la pointe

Quand l’informatique pose des étiquettes

Christelle Garreau
Patrick Gros, responsable de l'équipe Texmex.

 
Aujourd’hui, les images numériques sont partout, jusque sur les téléphones portables. Mais on ne peut pas les entasser comme des photos dans un tiroir. Il faut bien les trier. Les chercheurs de Texmex[1] y travaillent. Les systèmes informatiques qu’ils mettent au point permettront aux professionnels de l’image de passer du stockage à l’archivage.

 
 
Les stocks de données multimédia, numériques, sont énormes et grossissent de façon exponentielle. Pour que ces données soient réutilisables, il faut imaginer une façon de les identifier, tout comme pour les pièces d’une collection. « Nous travaillons par exemple avec l’Ina[2], qui est chargé de l’archivage des programmes de télévision, explique Patrick Gros, responsable de l’équipe. Archivage des six chaînes hertziennes, mais aussi, depuis 2002, de celles du câble et du satellite, soit 70 au total ». On imagine bien le volume considérable des données à manipuler pour faire de l’archivage et pas seulement du stockage. « Pour cela, les documentalistes de l’Ina passent près de 40% de leur temps à faire des retours ou avances rapides afin de localiser les débuts et fins de séquences, pubs, journal, météo, film, bandes annonces... Texmex travaille sur un programme qui permettra d’étiqueter les séquences pour supprimer ces 40% à faible valeur ajoutée ».
 
Les professionnels de l’image auront ainsi, pour chaque séquence, une étiquette sur laquelle il suffira de cliquer pour avoir la séquence associée du début à la fin. Cette étiquette pourra porter différentes informations utiles, comme la durée de la séquence, le sujet, la société de production, la date de création… Cet étiquetage peut se faire à différents niveaux. « Nous avons travaillé sur l’archivage des émissions Le Grand échiquier, sur la façon de trouver rapidement toutes les émissions avec tel invité ou tel thème ». Ce marquage effectué à un niveau plus fin pourrait avoir un autre intérêt, notamment pour les retransmissions sportives. « Dans un match de tennis, on pourrait par exemple étiqueter les phases de jeu, pour en extraire certaines, les premiers services gagnants ou les jeux les plus disputés ».
 
De la même façon, pour un match de foot, une autre équipe de l’Irisa a développé une technique pour extraire seulement les buts. « On sait qu’à ce moment-là du match la voix des commentateurs devient plus aiguë. On peut créer un signal associé au changement de tonalité et lancer une analyse d’images automatique à partir de là pour vérifier s’il s’agit bien d’une action au but ». Ainsi on peut faire des résumés de matchs de quelques minutes, et ne retenir que les instants décisifs. Ces résumés pourraient être proposés sur les portables de fans abonnés. « Sur ce genre de données, on peut imaginer beaucoup de choses. Nous disons que la sémantique est simple : au tennis, le joueur qui sert fait toujours le même geste. Donc sur le plan de l’analyse, c’est plus facile à identifier… Pour les films, c’est beaucoup plus compliqué ». Et pas forcément intéressant pour le public. Mais sûrement pour l’industrie du cinéma…
 
Christelle Garreau
 À cette séquence météo est associée une étiquette portant différents renseignements utiles, comme la date de diffusion.
C.G.


[1] Texmex : Technique d’exploitation des données multimédia.
[2] Ina : Institut national de l’audiovisuel.

 

Contact : Patrick Gros, tél. 02 99 84 74 28, Patrick.Gros@irisa.fr