Αναθεώρηση της Microsoft Azure: Αναθεώρηση επεξεργασίας φωνής αιχμής

Το Microsoft Azure Speech to Text είναι μία από τις πιο εξελιγμένες πλατφόρμες αναγνώρισης φωνής. Στο πλαίσιο της γκάμας προϊόντων της Microsoft Cognitive Speech Services, χρησιμοποιεί αλγορίθμους βαθιάς μάθησης για να ξεπεράσει την κακή ποιότητα ήχου και μπορεί να προσαρμοστεί σε διαφορετικά στυλ λόγου για ακριβείς μεταγραφές ήχου. Σε αυτήν την αναθεώρηση Microsoft Azure Speech to Text, θα εξετάσουμε προσεκτικά αυτή την υπηρεσία. 

Αξίζει να σημειωθεί ότι το Microsoft Azure Speech to Text δεν είναι ένα παραδοσιακό κομμάτι φιλικό προς το χρήστη λογισμικό υπαγόρευσης. Αντ ‘αυτού, πρόκειται για πλατφόρμα προσανατολισμένη στους προγραμματιστές που έχει σχεδιαστεί για να βοηθήσει τις επιχειρήσεις να δημιουργούν, να δοκιμάζουν και να διαχειρίζονται τα δικά τους προϊόντα. Εάν θέλετε απλώς να μεταγράψετε μια παρτίδα αρχείων ήχου, εναλλακτικές εφαρμογές ομιλίας σε κείμενο μπορεί να είναι μια καλύτερη επιλογή. Ρίξτε μια ματιά στον Καλύτερο οδηγό λογισμικού ομιλίας σε κείμενο για τις καλύτερες εναλλακτικές λύσεις.

Microsoft Azure Ομιλία σε κείμενο: Σχέδια και τιμολόγηση

Χρησιμοποιώντας το Microsoft Azure Speech to Text, μπορείτε να μεταγράψετε δωρεάν έως και πέντε ώρες ήχου δωρεάν και να δημιουργήσετε ένα προσαρμοσμένο μοντέλο φωνής ανά μήνα. Ωστόσο, με το ελεύθερο σχέδιο, υπάρχει μόνο ένα ενιαίο αίτημα ταυτόχρονης ηχοθέτησης κάθε φορά, πράγμα που σημαίνει ότι αυτή η επιλογή δεν είναι βιώσιμη για τις περισσότερες επιχειρήσεις.

Η τιμολόγηση της υπηρεσίας ομιλίας Azure χωρίζεται σε βήματα ενός δευτερολέπτου. (Πιστωτική εικόνα: Microsoft)

Αν θέλετε να μεταγράψετε ταυτόχρονα περισσότερα από ένα κλιπ ομιλίας, θα χρειαστεί να κάνετε αναβάθμιση στο τυπικό σύστημα τιμολόγησης Azure. Αυτό κοστίζει $ 1 ανά ώρα ήχου και υποστηρίζει μέχρι και 20 ταυτόχρονες αιτήσεις. Πρόσθετες χρεώσεις εμπλέκονται αν χρειαστεί να χρησιμοποιήσετε ένα προσαρμοσμένο μοντέλο ήχου ή να μεταγράψετε πολυκαναλικά αρχεία ήχου. Αυτές οι πρόσθετες υπηρεσίες κοστίζουν $ 1.40 και $ 2.10 ανά ώρα ήχου, αντίστοιχα.

Παρόλο που η Microsoft καταγράφει τις τιμές της σε ένα “ανά ώρα ήχου” όπως είναι το βιομηχανικό πρότυπο, η χρέωση είναι στην πραγματικότητα χωρισμένη σε βήματα ενός δευτερολέπτου, επομένως δεν θα πληρώσετε για περισσότερο χρόνο επεξεργασίας από τον απαιτούμενο.

Διαβάστε επίσης  Χέρια για: Xiaomi Mi 10 Pro αναθεώρηση

Microsoft Azure ομιλία σε κείμενο: Χαρακτηριστικά

Η βασική λειτουργία Azure Speech to Text είναι η πρόσβαση που παρέχει στο ισχυρό σύστημα επεξεργασίας φυσικής γλώσσας της Microsoft. Τα τελευταία χρόνια, η ομιλία AI της Microsoft έχει φτάσει σε πολλά σημαντικά ορόσημα. Αυτό σημαίνει ότι μπορεί πλέον να ολοκληρώσει εργασίες που προηγουμένως ήταν αδύνατες για μια υπηρεσία αναγνώρισης ομιλίας, όπως η ακριβής μεταγραφή της διασταυρούμενης ομιλίας κατά τη διάρκεια συνομιλιών μικρής ομάδας.

Η υπηρεσία Microsoft Office Speech to Text μπορεί να ενσωματωθεί στο Office 365 για βέλτιστη ακρίβεια. (Πιστωτική εικόνα: Microsoft)

Το Azure συνεργάζεται με δεκάδες γλώσσες και διαλέκτους και μπορεί να εκπαιδευτεί – χρησιμοποιώντας προσαρμοσμένα μοντέλα αναγνώρισης ομιλίας – για να προσαρμοστεί καλύτερα στο στυλ μιλώντας του χρήστη, στο θόρυβο του περιβάλλοντος περιβάλλοντος και στο λεξιλόγιο. Εάν ο οργανισμός σας έχει ήδη δεσμευτεί για το οικοσύστημα προϊόντος της Microsoft, μπορείτε να επωφεληθείτε από τα δεδομένα του Office 365 χρήστη για να βελτιώσετε την ακρίβεια της αναγνώρισης ομιλίας για τους όρους της συγκεκριμένης οργάνωσης. Και, κυρίως, αυτό μπορεί να γίνει χωρίς να διακυβεύεται η ασφάλεια των δεδομένων σας, επειδή η ομιλία σε κείμενο μπορεί να εκτελεστεί σε χώρους.

Microsoft Azure Ομιλία σε κείμενο: Εγκατάσταση

Η Microsoft Azure έχει σχεδιαστεί για προγραμματιστές και όχι για καταναλωτές. Αυτό σημαίνει ότι η δημιουργία του είναι μια διαδικασία εμπλεκόμενη και κάπως προκλητική που αφεθεί καλύτερα σε κάποιον με μεγάλη τεχνική τεχνογνωσία. 

Η εγκατάσταση του Azure δεν είναι ακριβώς απλή, εκτός εάν έχετε εμπειρία κωδικοποίησης. (Πιστωτική εικόνα: Microsoft)

Ο γρηγορότερος τρόπος για να ρυθμίσετε το Azure είναι να χρησιμοποιήσετε το Azure Speech SDK σε γλώσσα προγραμματισμού όπως Java ή C ++. Για αυτό, θα πρέπει να εγγραφείτε για έναν δωρεάν λογαριασμό Azure και να δημιουργήσετε ένα κενό έργο στο αναπτυξιακό σας περιβάλλον. Στη συνέχεια, θα πρέπει να χρησιμοποιήσετε το Microsoft Visual Studio και να γράψετε ένα σύντομο πρόγραμμα για την προετοιμασία του αντικειμένου SpeechRecognizer της Microsoft. 

Διαβάστε επίσης  Garmin Vivoactive 4 αναθεώρηση

Microsoft Azure ομιλία σε κείμενο: διασύνδεση

Όπως και σε άλλες πλατφόρμες μεταγραφής, το Microsoft Azure Speech to Text προορίζεται να λειτουργήσει ως διεπαφή προγραμματισμού εφαρμογών (API), που προστίθεται στα προγράμματα του Office 365 ή ενσωματώνεται σε νέες πλατφόρμες και υπηρεσίες. Εξαιτίας αυτού, δεν υπάρχει ενιαία διεπαφή Azure Speech to Text. Αυτό που βλέπει ο τελικός χρήστης εξαρτάται από το πώς έχει ενσωματωθεί το Azure Speech to Text.

Η ηλεκτρονική πύλη Azure είναι διαισθητική και εύκολη στη χρήση. (Πιστωτική εικόνα: Microsoft)

Εν τω μεταξύ, ο προγραμματιστής που διαχειρίζεται την Azure θα το κάνει μέσω του online Azure Portal της Microsoft, το οποίο αισθάνεται σύγχρονο και εύκολο στην πλοήγηση. Χρειάζονται μόνο λίγα λεπτά για να εντοπίσετε τη σελίδα των πόρων της υπηρεσίας ομιλίας και, αφού προστεθεί μια παράσταση στο λογαριασμό σας, η παρακολούθηση ειδοποιήσεων και η χρήση μπορούν να προβληθούν σε ένα μόνο παράθυρο.

Microsoft Azure Ομιλία σε κείμενο: Απόδοση

Ως μέρος της ανασκόπησης του Microsoft Azure Speech to Text, ήμασταν πρόθυμοι να δούμε πώς αυτή η πλατφόρμα αντιμετώπιζε την πρόκληση της επεξεργασίας ακατέργαστων φωνητικών εγγραφών έτσι, μόλις ο λογαριασμός Azure ήταν έτοιμος να μεταβεί, ανεβάσαμε μια σειρά κλιπ με διαφορετικά επίπεδα θορύβου . Σε ολόκληρο το σκάφος, η Azure έκανε καλή δουλειά στην επεξεργασία των δειγμάτων μας, καθώς δεν διαπιστώσαμε παρά λίγα λάθη κατά τη διάρκεια της αξιολόγησης.

Η ενεργοποίηση του προσαρμοσμένου μοντέλου ομιλίας της Azure βελτίωσε την ακρίβεια της μεταγραφής. (Πιστωτική εικόνα: Microsoft)

Το Azure αντιμετώπισε ελαφρώς δυσκολία όταν επεξεργάστηκε ασυνήθιστες φράσεις ή εξειδικευμένες φράσεις όπως τα ονόματα των αθλητικών ομάδων και τους επιστημονικούς όρους, αλλά αυτό επιλύθηκε γρήγορα επιτρέποντας την επιλογή εξαγωγής προσαρμοσμένου μοντέλου. Μόλις ενεργοποιήσαμε αυτή την επιλογή, η Azure ήταν σε θέση να προσαρμοστεί στο μοναδικό λεξιλόγιο και το στυλ της ομιλίας που χρησιμοποιήσαμε.

Διαβάστε επίσης  Απομακρυσμένες εφαρμογές για ανασκόπηση των Windows: Η καλύτερη απομακρυσμένη επιφάνεια εργασίας για Windows; ανασκόπηση

Microsoft Azure Ομιλία σε κείμενο: Υποστήριξη

Για να μάθετε πώς να αλληλεπιδράτε με το SDK του Azure Speech Services μέσω διαφορετικών γλωσσών προγραμματισμού και να ενσωματώσετε τις λειτουργίες του Azure Speech to Text στη δική σας πλατφόρμα, σίγουρα θα χρειαστείτε κάποια βοήθεια. Ευτυχώς, η Microsoft έχει δημιουργήσει ένα ολοκληρωμένο κατάλογο εκπαιδευτικών υλικών για την πλατφόρμα Azure, στην οποία θα βρείτε παραδείγματα κώδικα και εύχρηστες συμβουλές. 

Το τμήμα εκπαίδευσης του ιστότοπου Azure περιέχει πολλούς χρήσιμους πόρους. (Πιστωτική εικόνα: Microsoft)

Επίσης, όλοι οι πελάτες της Azure λαμβάνουν δωρεάν υποστήριξη χρέωσης και συνδρομής διαχείρισης, η οποία μπορεί να αποκτηθεί μέσω ενός συστήματος εισιτηρίων. Μια πιο εμπεριστατωμένη υποστήριξη μπορεί να προστεθεί στο λογαριασμό σας για μια επαναλαμβανόμενη αμοιβή, ξεκινώντας από $ 29 το μήνα.

Microsoft Azure Ομιλία σε κείμενο: Τελική ετυμηγορία

Η πλατφόρμα Azure Speech to Text χρησιμοποιεί τεχνολογία αιχμής για να παρέχει μια σχεδόν τέλεια υπηρεσία μεταγραφής. Είναι το πλέον κατάλληλο για επιχειρήσεις που έχουν ήδη επενδύσει στο οικοσύστημα του Microsoft Office 365 επειδή τα προσαρμοσμένα μοντέλα φωνής και λεξιλογίου μπορούν να δημιουργηθούν με ασφάλεια από το υπάρχον αρχείο αρχείων σας. Ορισμένες μικρές επιχειρήσεις ενδέχεται να αγωνιστούν με το Azure καθώς η ρύθμιση τους απαιτεί σωστή προσοχή από έναν εξειδικευμένο προγραμματιστή του Microsoft Cloud.

Ο ανταγωνισμός

Το Amazon Transcribe, το Google Cloud Speech-to-Text και το Watson Speech to Text είναι άμεσοι ανταγωνιστές της Microsoft Azure. Αυτές οι τρεις πλατφόρμες είναι επίσης όλες ικανές να εκτελούν ακριβείς μεταγραφές παρτίδων μεγάλου όγκου. Το Google Cloud είναι ο μόνος στενός ανταγωνιστής που μπορεί να συνεργαστεί με περισσότερες γλώσσες από την Azure και είναι επίσης φθηνότερη, με ένα αρχικό ποσοστό μόλις 0,006 $ ανά λεπτό σε σύγκριση με τα $ 0,017 της Azure.

Για να βρείτε άλλες εναλλακτικές λύσεις για το Microsoft Azure Speech to Text, ανατρέξτε στον οδηγό μας Best word-to-text.

Αναθεώρηση Sony A7C

Ανακοινώθηκε τον Σεπτέμβριο του 2020, το Sony A7C κατέχει το βραβείο του μικρότερου και ελαφρύτερου συστήματος κάμερας πλήρους καρέ στον κόσμο. Στην ουσία, η...

Αναθεώρηση Samsung Galaxy Book Flex: ένας premium φορητός υπολογιστής Windows 2 σε 1

Με το Samsung Galaxy Book Flex, η Samsung σας προσφέρει καθημερινή υπολογιστική ισχύ σε μια συσκευή που ξεχωρίζει περισσότερο όσον αφορά το σχεδιασμό και...

Αναθεώρηση Fujifilm X-T30

Για εκείνους τους φωτογράφους που λαχταρούν το ρετρό στιλ - όσον αφορά τόσο το σχεδιασμό όσο και τη λειτουργία - οι φωτογραφικές μηχανές της...

Αναθεώρηση Nikon D5600

Με στόχο τους επίδοξους φωτογράφους, η αποτελεσματική ανάλυση D5600 των 24,2 megapixel της Nikon διαθέτει έναν τυπικό αισθητήρα μεγέθους APS-C της κατηγορίας, καθώς και...