Accéder au contenu principal

Sélection

Gemma, la nouvelle famille de modèles de Google

 Gemma, la nouvelle famille de modèles ouverts et légers de Google. Hello la team #TheDayInfo, le 21 février 2024, Google a dévoilé Gemma, une nouvelle famille de modèles ouverts et légers dont la conception repose sur les mêmes recherches et technologies qui ont servi à créer Gemini(Ancien Bard).  Le petit frère de Gemini? 😒 Humm, on peut le dire ainsi mais pas tout à fait car son utilisation est plus axé sur la création de modèles ML pour le traitement naturel du langage(NLP) donc pour les développeurs plutôt que sur la collaboration IA comme Gemini.   Introduction à Gemma Les modèles de la famille Gemma sont en deux versions 2B et 7B.  Le modèle Gemma 2B(Deux milliards de paramètres) est destiné aux CPU et applications sur appareils tandis que le modèle Gemma 7B(Sept milliards de paramètres) est destiné aux déploiements efficients et déploiements sur CPU et GPU.  Ces nouveaux modèles sont utilisés dans la conception des modèles de machine learning en NLP(Natural Language processin

Les algorithmes d'apprentissage supervisé en Machine Learning

 Quels sont les algorithmes d'apprentissage supervisé les plus répandus en ML ? 


C'est un réel plaisir de vous retrouver la team #TheDayInfo 😎pour un nouvel article. 

Nous allons découvrir aujourd'hui les algorithmes d'apprentissage supervisé en ML(Machine Learning). 

Pour tout savoir sur la méthode d'apprentissage supervisé, je vous invite à lire mon article là dessus.

Exemple d'un algorithme en Python
Exemple d'un algorithme



Le SVM (Support Vector Machine)

En apprentissage supervisé, lorsqu'on veut résoudre des problèmes de régression, de classification ou détecter des valeurs abbérantes avec moins de puissance de calcul, SVM est l'algorithme de choix. 

Le principe ici avec le SVM est de trouver un hyperplan dans un espace à N-dimensions (avec N = au nombre de caractéristiques) qui classe distinctivement les points de données.

Arbre de décision(Decision tree)

Comme son nom l'indique, c'est un arbre qui aide à la prise de décision. 

Pour faire simple, vous avez des données sur le prix des maisons. le prix d'une maison dépend des caractéristiques tel que: le nombre de chambre à coucher, le nombre de salle de bain, la superficie du terrain, présence de garage ou pas...etc 

Ainsi, à chaque fois que nous avons certaines caractéristiques, nous avons un prix. Cet ensemble constitue une feuille de l'arbre et au fur et à mesure qu'on divise la variable cible(la maison), nous aurons une feuille qui est une valeur de la variable cible. 

Régression Linéaire(Linear Regression)

La régression linéaire dans le cas de l'apprentissage supervisé est de trouver une variable dépendante Y à l'aide d'une variable indépendante X.

En cas pratique, nous pouvons avec la régression linéaire, chercher à prédire la pression artérielle(Y) en fonction de l'âge (X) du patient.

K-NN(K-Nearest Neighbour)

L'algorithme du plus proche voisin est un algorithme particulier car il utilise la totalité des données sans les diviser en données d'entrainement et de test. 

Ensuite, lorsque de nouvelles données apparaissent, il parcourt l'ensemble des données à la recherche du K-instance similaire au nouveau k-instance et renvoi la moyenne des résultats. Le calcul de similarité se fait soit avec la distance Euclidienne ou la distance de Hamming.

Voilà, c'est tout pour aujourd'hui et j'espère avoir vos retours sur cet article. 



Commentaires

Articles les plus consultés

Follow @ArmelYara