AI – Ποια είναι η κινεζική startup που απειλεί την κυριαρχία των ΗΠΑ
ΕΙΔΗΣΕΙΣΕΠΙΧΕΙΡΕΙΝΚΟΙΝΩΝΙΑΚΟΣΜΟΣ 28 Ιανουαρίου 2025 fonisalaminas
Η DeepSeek βρίσκεται στο επίκεντρο των εξελίξεων στον τομέα της τεχνητής νοημοσύνης, δημιουργώντας ερωτήματα για το μέλλον του ανταγωνισμού ΗΠΑ-Κίνας
Η DeepSeek, μια ανερχόμενη startup από την Κίνα, κλονίζει την παγκόσμια ισορροπία στον τομέα της τεχνητής νοημοσύνης (AI).
Με τα μοντέλα DeepSeek-V3 και DeepSeek-R1, που ισχυρίζεται ότι είναι ισάξια ή καλύτερα από τα κορυφαία αμερικανικά αντίστοιχα, η εταιρεία ανατρέπει την τεχνολογική πρωτοκαθεδρία των ΗΠΑ με εξαιρετικά μειωμένο κόστος.
Η επιτυχία της DeepSeek τράβηξε την προσοχή όταν δημοσίευσε μια έρευνα, δηλώνοντας ότι η εκπαίδευση του μοντέλου DeepSeek-V3 κόστισε λιγότερο από 6 εκατομμύρια δολάρια, χρησιμοποιώντας εξοπλισμό Nvidia H800.
Παράλληλα, η εφαρμογή της εταιρείας ξεπέρασε το ChatGPT και έγινε η κορυφαία δωρεάν εφαρμογή στο Apple App Store των ΗΠΑ, γεγονός που έφερε αναταράξεις στις μετοχές τεχνολογικών κολοσσών, όπως η Nvidia.
Η απελευθέρωση του ChatGPT της OpenAI στα τέλη του 2022 προκάλεσε αναταραχή μεταξύ των κινεζικών εταιρειών τεχνολογίας, οι οποίες έσπευσαν να δημιουργήσουν τα δικά τους chatbots που υποστηρίζονται από τεχνητή νοημοσύνη.
Αλλά μετά την κυκλοφορία του πρώτου κινεζικού ισοδύναμου ChatGPT, που έγινε από τον γίγαντα των μηχανών αναζήτησης Baidu 9888.HK , υπήρξε ευρεία απογοήτευση στην Κίνα για το χάσμα στις δυνατότητες τεχνητής νοημοσύνης μεταξύ αμερικανικών και κινεζικών εταιρειών.
Η ποιότητα και η αποδοτικότητα κόστους των μοντέλων της DeepSeek έχουν ανατρέψει αυτή την αφήγηση.
Τα δύο μοντέλα που έχουν κατακλυστεί με επαίνους από στελέχη της Silicon Valley και μηχανικούς αμερικανικών τεχνολογικών εταιρειών, το DeepSeek-V3 και το DeepSeek-R1, είναι εφάμιλλα με τα πιο προηγμένα μοντέλα της OpenAI και της Meta, δήλωσε η κινεζική startup.
Είναι επίσης φθηνότερα. Το DeepSeek-R1, που κυκλοφόρησε την περασμένη εβδομάδα, είναι 20 έως 50 φορές φθηνότερο στη χρήση από το μοντέλο OpenAI o1, ανάλογα με την εργασία, σύμφωνα με ανάρτηση στον επίσημο λογαριασμό WeChat της DeepSeek.
Ωστόσο, υπάρχουν αμφιβολίες για το πώς πέτυχε αυτή την απόδοση. Αναλυτές υποστηρίζουν ότι το πραγματικό κόστος εκπαίδευσης των μοντέλων είναι υψηλότερο από τα ανακοινωθέντα, ενώ ανώτερα στελέχη, όπως ο Αλεξάντρ Βανγκ της Scale AI, αφήνουν αιχμές για παραβιάσεις αμερικανικών ελέγχων εξαγωγών προηγμένων chips.
Στη διάρκεια συνέντευξης στο CNBC την Πέμπτη, χωρίς να παρέχει αποδείξεις, ο Βανγκ είπε ότι η DeepSeek διαθέτει 50.000 τσιπ Nvidia H100, τα οποία, όπως ισχυρίστηκε, δεν θα αποκαλύψει, διότι αυτό θα παραβίαζε τους ελέγχους εξαγωγών της Ουάσιγκτον που απαγορεύουν την πώληση τέτοιων προηγμένων τσιπ τεχνητής νοημοσύνης σε κινεζικές εταιρείες.
Η DeepSeek δεν απάντησε σε αίτημα για σχολιασμό του ισχυρισμού.
Οι αναλυτές της Bernstein τόνισαν τη Δευτέρα σε ερευνητικό σημείωμα ότι το συνολικό κόστος εκπαίδευσης της DeepSeek για το μοντέλο V3 ήταν άγνωστο, αλλά ήταν πολύ υψηλότερο από τα 5,58 εκατομμύρια δολάρια που δήλωσε η νεοσύστατη επιχείρηση ότι χρησιμοποιήθηκαν για υπολογιστική ισχύ.
Οι αναλυτές ανέφεραν επίσης ότι το κόστος εκπαίδευσης του εξίσου φημισμένου μοντέλου R1 δεν αποκαλύφθηκε.
Η καινοτομία της DeepSeek
Η DeepSeek εμφανίζεται ως ο ηγέτης της νέας γενιάς AI, παρέχοντας υψηλή ποιότητα και κόστος έως 50 φορές μικρότερο από τους ανταγωνιστές της, σύμφωνα με τα επίσημα στοιχεία της εταιρείας. Οι επιδόσεις της έχουν επαινεθεί από κορυφαίους μηχανικούς της Silicon Valley, ενώ η εστίαση της DeepSeek στην Γενική Τεχνητή Νοημοσύνη (AGI) την καθιστά πρωτοπόρο στον χώρο.
Η στρατηγική σύνδεση με το Πεκίνο
Η DeepSeek είναι μια νεοσύστατη επιχείρηση με έδρα τη Χανγκζού, της οποίας ο κύριος μέτοχος είναι ο Λιανγκ Γουενφέγκ, συνιδρυτής του hedge fund High-Flyer, με βάση τα κινεζικά εταιρικά αρχεία.
Το hedge fund του Λιανγκ ανακοίνωσε τον Μάρτιο του 2023 στον επίσημο λογαριασμό του στο WeChat ότι «ξεκινούσε», ξεπερνώντας τις εμπορικές συναλλαγές για να συγκεντρώσει τους πόρους του στη δημιουργία μιας «νέας και ανεξάρτητης ερευνητικής ομάδας, για να εξερευνήσει την ουσία της Γενικής Τεχνητής Νοημοσύνης». Η DeepSeek δημιουργήθηκε αργότερα το ίδιο έτος.
Δεν είναι σαφές πόσο έχει επενδύσει η High-Flyer στην DeepSeek.
Η High-Flyer έχει ένα γραφείο στο ίδιο κτίριο με την DeepSeek και κατέχει επίσης διπλώματα ευρεσιτεχνίας που σχετίζονται με συστάδες τσιπ που χρησιμοποιούνται για την εκπαίδευση μοντέλων AI, σύμφωνα με τα κινεζικά εταιρικά αρχεία.
Η μονάδα AI της High-Flyer δήλωσε στον επίσημο λογαριασμό της στο WeChat τον Ιούλιο του 2022 ότι κατέχει και λειτουργεί ένα cluster 10.000 τσιπ A100.
Η επιτυχία της DeepSeek έχει ήδη γίνει αντιληπτή στους κορυφαίους πολιτικούς κύκλους της Κίνας. Στις 20 Ιανουαρίου, την ημέρα που το DeepSeek-R1 κυκλοφόρησε στο κοινό, ο Λιανγκ συμμετείχε σε ένα συμπόσιο κεκλεισμένων των θυρών για επιχειρηματίες και εμπειρογνώμονες που διοργάνωσε ο Κινέζος πρωθυπουργός Λι Τσιανγκ, σύμφωνα με το κρατικό πρακτορείο ειδήσεων Xinhua.
Η παρουσία του Λιανγκ είναι ενδεχομένως ένα σημάδι ότι η επιτυχία του DeepSeek θα μπορούσε να είναι σημαντική για τον πολιτικό στόχο του Πεκίνου να ξεπεράσει τους εξαγωγικούς ελέγχους της Ουάσιγκτον και να επιτύχει αυτάρκεια σε στρατηγικούς κλάδους όπως η τεχνητή νοημοσύνη.
Σε παρόμοιο συμπόσιο πέρυσι συμμετείχε ο διευθύνων σύμβουλος της Baidu, Ροντίν Λι.
kathimerini.com.cy