Vous n'êtes pas identifié.
Salut,
Je viens de tomber sur ça :
developpez.com
Est-ce qe vous êtes d'accord ? Vous en connaissez combien parmi tout cela. Parce qu'en ce qui me concerne j'en connais que peu parmi ceux proposé et je suis pas d'accord avec tout.
Les algorithmes géométriques sont très important par exemple la triangulation, la segmentation (important pour le traitement des données des IRM), ...
Hors ligne
Je connais la plupart, mais je suis pas forcément d'accord avec tout non plus. Et puis la liste n'est pas forcément bien faite. On peut pas mettre "programmation dynamique" dans la liste qui contient déjà A*...
Hors ligne
Lol en faisant la liste y en a pas mal d'inconnu 
Et pas mal d'intéressant et marrant par exemple RANSAC 
Inconnu : Beam Search, Branch and bound, Buchberger's algorithm, Diffie-Hellman key exchange, Expectation-maximization algorithm, LLL algorithm, Maximum flow, Q-learning, Quadratic sieve, RANSAC, Singular value decomposition, Strukturtensor, Viterbi algorithm
Bon je vous laisse j'ai du boulot j'en ai pas mal à voir...
Hors ligne
La liste vient d'un post sur un blog de développeur, ça aurait peut-être été plus intéressant de faire un sondage et un vote...
Quoi qu'il en soit, il est vrai que "programmation dynamique" n'a pas trop sa place, et comme il a été dit sur le forum de developpez.com : où est Min/Max ??
Hors ligne
Flot max est dedans, non? C'est maximum flow justement, que skone mentionne.
SVD est super important, mais c'est assez mathématique. Chaud de comprendre l'utilité juste en lisant une description.
Viterbi sert à décoder des chaines codées dans lesquelles il peut y avoir des erreurs (théorie de l'information)
Funto>>
Branch and bound est utile en optimisation discrète, quand il faut explorer un arbre potentiellement très grand; ça revient à min/max avec pruning alpha-beta en fait.
Expectation maximization (EM) sert à optimiser des fonctions non linéaires qui apparaissent en probabilité, pour calculer des estimateurs quand on sait pas résoudre les équations explicitement. C'est essentiellement un procédé itératif, rien de bien intelligent.
Q-Learning est une forme d'apprentissage par renforcement, type algorithme des fourmis.
Hors ligne
@Kirua : je répondais à SKone pour le flot max. J'étais juste étonné qu'il ne connaisse pas.
Hors ligne
Le flox max n'équivaut pas à un "recherche chemin le plus court" à l'envers ? (Donc le chemin le plus long)
Dernière modification par SKone (08-07-2010 10:18:04)
Hors ligne
Kirua a écrit:
SVD est super important, mais c'est assez mathématique. Chaud de comprendre l'utilité juste en lisant une description.
Love it !
Je l'ai utilisé en deux situations :
- Résolution approchée et partielle d'équations aux valeurs propres (plutôt maths)
- Profilage de population (plutôt analyse de données) << et c'est là que c'est génial.
Hors ligne
Le deuxième usage que tu rapportes s'appelle plus classiquement une PCA (analyse en composantes principales). C'est utile, mais faut rester prudent quand on s'en sert pour analyser des données sociologiques/démographiques/... Il y a quand même une grosse hypothèse de linéarité sous-jacente.
Hors ligne
C'est exact mais c'est quand même très performant, même en prédiction, dans certains cas.
Et surtout il y a des méthodes qui permettent de faire cette analyse avec des données manquantes (souvent le cas sur des populations réelles)...
Hors ligne
Yep, de fait. Un ancien de mon département (maths appliquées) qui est mtnt consultant expliquait que bcp de boîtes ont des bases de données énormes sur leurs clients mais ne les exploitent pas. Du coup, quand t'arrives et que tu fais une (pas trop trop bête) régression linéaire sur leurs données et que tu fais des prédictions simples avec ça, ça fait souvent un gros plus pour la boîte en question. C'est furieux, mais c'est la vraie vie
.
Hors ligne
Hors-sujet:
Tu connais le NetflixPrize ?
80 % des équipes avec un score correct (pas le top 10 hein !) ont procédé ainsi.
Approximation d'une simili-SVD par apprentissage pour prédire l'appréciation (une note de 1 à 5) d'un client pour un film sachant les notes de ce client pour d'autres films et les notes d'autres clients pour ce film (et d'autres).
Hors ligne
Je trouve pas ça HS du tout...
T'as des précisions sur les méthodes utilisées par ledit top 10 ?
SKone -> t'es abonné à la newsletter toi
j'avais reçu le lien aussi 

Hors ligne
Yep, le concours Netflix existe déjà depuis pas mal d'années, c'est assez fun comme concept. Pendant longtemps, ce sont les méthodes à base de SVD qui étaient gagnantes, c'est assez classieux qd même, parce que pas forcément compliqué (dans la version "pas trop de données")
.
Hors ligne
Oui m'enfin pas trop de données... Netflix la base fait plus 2 Go sachant qu'elle contient uniquement 2 tables en gros : date de notation, note, id user, id film pour l'une et id film, titre, date de parution pour l'autre, ça fait pas mal de lignes...
Pour ce qui est du top 10... C'est pas facile à expliquer mais les papiers sont tous publiés si ça vous intéresse. Pour faire vite déjà il faut dire qu'ils se basent tous sur de la fusion linéaire d'environ une centaine de modèles divers et variés incluant :
- Des modèles factoriels (dont la SVD)
- Des modèles de voisinage (estimation que tel client est voisin proche de tel autre)
- Des modèles mixtes
- Et pour les meilleurs résultats de la toute fin, ils ont introduit des modèles temporels. Mais là les papiers deviennent trop chauds à comprendre pour mon petit cerveau.
Hors ligne
( avec un peu de lag... : )
Kirua a écrit:
Le deuxième usage que tu rapportes s'appelle plus classiquement une PCA (analyse en composantes principales). C'est utile, mais faut rester prudent quand on s'en sert pour analyser des données sociologiques/démographiques/... Il y a quand même une grosse hypothèse de linéarité sous-jacente.
T'as mieux ? On s'est arrêtés là en cours...

Hors ligne
Quand l'hypothèse de non linéarité est formulée, on va se tourner vers les réseaux de neurones principalement.
Hors ligne
Effectivement, pour faire du fitting non linéaire tu peux utiliser des méthodes style réseaux de neurones ou radial basis functions, mais les problèmes d'interprétabilité restent.
Si tu gardes l'hypothèse de linéarité, il y a l'analyse en composantes indépendantes (ICA) qui est assez cool. Imagine une pièce où deux personnes parlent simultanément (deux signaux indépendants) et deux micros dans la pièce (deux mesures qui sont des combinaisons "linéaires" des paroles), le but du jeu est de récupérer les deux signaux de parole séparément (plutôt que superposés, comme mesuré par les micros). L'hypothèse d'indépendance est fondamentale pour ce jeu-là.
C'est notament une façon de faire un electrocardiogramme du foetus sans transpercer la maman: les battements de coeur de la maman et du foetus sont des signaux indépendants; tu mets des micros à différents endroits sur la maman et puis tu ICA les mesures. C'est un peu plus compliqué en réalité, mais c'est l'idée disons.
Hors ligne
Vais jeter un coup d'oeil, merci 

Hors ligne
Je ne savais pas qu'il y avait des ACI en temps réel !
Sympa.
Dernière modification par patemino (03-08-2010 11:14:35)
Hors ligne