Την Πέμπτη, το γαλλικό εργαστήριο Mistral AI ξεκίνησε το Small 3, το οποίο η εταιρεία καλεί το “πιο αποτελεσματικό μοντέλο της κατηγορίας της” και λέει ότι είναι βελτιστοποιημένη για καθυστέρηση.
Το Mistral λέει ότι το Small 3 μπορεί να ανταγωνιστεί με το LLAMA 3.3 70B και το QWEN 32B, μεταξύ άλλων μεγάλων μοντέλων, και αυτό είναι μια “εξαιρετική ανοιχτή αντικατάσταση για αδιαφανή ιδιόκτητα μοντέλα όπως το GPT4O-Mini”.
Επίσης: Οι πράκτορες AI θα αντιστοιχούν σε μηχανικούς “Good Middle -Level” φέτος, λέει ο Mark Zuckerberg
Όπως και άλλα μοντέλα MISTRAL, οι παράμετροι 24B Small 3 παρουσιάζονται με κώδικα ανοιχτού κώδικα, που απελευθερώνεται με την άδεια Apache 2.0.
Σύμφωνα με το Mistral, για τοπική χρήση, το Small 3 παρέχει μια βάση δεδομένων για ικανότητες συλλογιστικής. “Το Small 3 ξεπερνά τα σενάρια όπου οι γρήγορες, ακριβείς απαντήσεις είναι κρίσιμες”, συνεχίζεται η απελευθέρωση, σημειώνοντας ότι το μοντέλο έχει λιγότερα στρώματα από τα συγκρίσιμα μοντέλα, τα οποία βοηθούν την ταχύτητά του.
Το μοντέλο έφθασε στην ακριβή ακρίβεια του 81% στη δοκιμή MMLU και εκπαιδεύτηκε σε εκπαίδευση (RL) ή συνθετικά δεδομένα που, σύμφωνα με το Mistral, το καθιστούν “νωρίτερα στον αγωγό παραγωγής του μοντέλου” από το Deepseek R1.
“Το μοντέλο μας, το οποίο έχει διαμορφωθεί στις οδηγίες, λειτουργεί ανταγωνιστικά με μοντέλα τριών φορές του μεγέθους του και με το ιδιόκτητο μοντέλο GPT4O-Mini με κώδικα, μαθηματικά, συνολικές γνώσεις και οδηγίες μετά από κριτήρια”, σημειώνει η ανακοίνωση.
Χρησιμοποιώντας έναν τρίτο προμηθευτή, η Mistral διεξήγαγε ανθρώπινους εκτιμητές μικρών 3 δοκιμών με περισσότερες από 1000 συμβουλές κωδικοποίησης και πανεπιστημίων. Οι περισσότεροι δοκιμαστές προτιμούσαν μικρά 3 έως GEMMA-2 27B και QWEN-25 32B, αλλά οι αριθμοί διαχωρίστηκαν πιο ομοιόμορφα όταν τα μικρά 3 αντιτάχθηκαν LLAMA-3.3 70B και GPT-4O MINI. Το Mistral αναγνώρισε τις αποκλίσεις στην ανθρώπινη κρίση που καθιστούν αυτή τη δοκιμασία να διαφέρει από τα τυποποιημένα κοινωνικά κριτήρια.
Επίσης: Οι ερευνητές της Apple αποκαλύπτουν τη μυστική σάλτσα που στέκεται πίσω από το Deepseek AI
Το Mistral συνιστά το Small 3 για τη δημιουργία εικονικών βοηθών που επικεντρώνονται στον πελάτη, ειδικά για τις ανάγκες γρήγορου κύκλου εργασιών, όπως η ανίχνευση απάτης σε χρηματοπιστωτικές υπηρεσίες, νομικές διαβουλεύσεις και υγειονομική περίθαλψη, επειδή μπορεί να διαμορφωθεί με ακρίβεια ώστε να δημιουργεί “πολύ ακριβείς εμπειρογνώμονες στο θέμα”, σύμφωνα με για απελευθέρωση.
Το Small 3 μπορεί επίσης να χρησιμοποιηθεί για ρομποτική και παραγωγή και μπορεί να είναι ιδανική για “ερασιτέχνες και οργανισμούς που εμπλέκονται σε εμπιστευτικές ή δικές τους πληροφορίες”, καθώς μπορεί να ξεκινήσει στο MacBook με τουλάχιστον 32 GB μνήμης RAM.
Το Mistral διώχουμε ότι μπορούμε να περιμένουμε περισσότερα μοντέλα διαφόρων μεγεθών “με αυξημένες δυνατότητες συλλογιστικής τις επόμενες εβδομάδες”. Μπορείτε να έχετε πρόσβαση στο Small 3 στο Hugingface εδώ.