Watson Ομιλία σε κριτική κειμένου: Η καλύτερη υπηρεσία μεταγραφής υψηλού όγκου; ανασκόπηση

Το Watson είναι το ηλεκτρονικό σύστημα επεξεργασίας φυσικής γλώσσας της IBM. Εξουσιοδοτεί τον διάσημο υπερυπολογιστή απάντησης ερωτήσεων, καθώς και μια σειρά από επιχειρησιακά προϊόντα που βασίζονται στο AI, συμπεριλαμβανομένου του Watson Speech to Text. Στο Watson Speech to Review κειμένου, θα ρίξουμε μια ματιά σε μία από τις καλύτερες εφαρμογές ομιλίας σε κείμενο, ιδανική για όποιον θέλει να μετατρέψει ήχο σε κείμενο σε κλίμακα.

Η πλατφόρμα επεξεργασίας ομιλίας Watson είναι διαθέσιμη στο IBM Cloud. Είναι ένα ευέλικτο εργαλείο και μπορεί να χρησιμοποιηθεί σε πολλά πλαίσια, συμπεριλαμβανομένης της υπαγόρευσης και της κλήσης συνδιάσκεψης. Επιπλέον, σε αντίθεση με τις περισσότερες άλλες εφαρμογές ομιλίας σε κείμενο, είναι διαθέσιμη ως API, επιτρέποντας στους προγραμματιστές να την ενσωματώσουν σε συστήματα φωνητικού ελέγχου, μεταξύ άλλων.

Watson Ομιλία στο κείμενο: Σχέδια και τιμολόγηση

Μπορείτε να χρησιμοποιήσετε το Watson Speech to Text για να επεξεργαστείτε μέχρι και 500 λεπτά ήχου δωρεάν ανά μήνα. Εάν θέλετε να μετατρέψετε περισσότερα από αυτό, θα χρειαστεί να πληρώσετε για κάθε ακουστικό λεπτό και η ταχύτητα θα αλλάξει ανάλογα με τη διάρκεια του επεξεργασμένου ήχου. Το κόστος κυμαίνεται από $ 0.01 έως $ 0.02 ανά λεπτό και υπάρχει πρόσθετο τέλος $ 0.03 ανά λεπτό εάν χρειάζεστε το Προσαρμοσμένο Μοντέλο Γλώσσας της IBM. Προσφέρονται επίσης προγράμματα αποκλειστικής προσφοράς μόνο για Watson, τα οποία παρέχουν πρόσβαση σε βελτιωμένα χαρακτηριστικά προστασίας προσωπικών δεδομένων και εγγύηση uptime.

Η υπηρεσία ομιλίας-προς-κειμένου του Watson βασίζεται στον όγκο του περιεχομένου που πρέπει να μεταγράψετε. (Πιστωτική εικόνα: IBM)

Μπορείτε επίσης να αποκτήσετε πρόσβαση στο σύστημα Watson Speech to Text μέσω μιας γενικής χρήσης συνδρομής του IBM Cloud. Η επεξεργασία φυσικής γλώσσας είναι μια μόνο εφαρμογή σε ένα ευρύ φάσμα υπηρεσιών AI που μπορείτε να αποκτήσετε μέσω του IBM Cloud, επομένως αυτή είναι μια καλή επιλογή για κάθε οργανισμό που χρειάζεται πρόσβαση σε μεταφορές δεδομένων υψηλής ταχύτητας, chatbots ή εργαλεία κειμένου σε ομιλία.

Διαβάστε επίσης  Αναβαθμίστε την αναθεώρηση του αναγνώστη καρτών

Watson ομιλία σε κείμενο: Χαρακτηριστικά

Χάρη στην ευέλικτη ενσωμάτωση του API και σε άλλα εργαλεία της IBM, η υπηρεσία αναγνώρισης ομιλίας Watson πηγαίνει πολύ πέρα ​​από τη βασική μεταγραφή. Αν θέλετε να το χρησιμοποιήσετε σε ένα περιβάλλον εξυπηρέτησης πελατών, για παράδειγμα, ο βοηθός Watson Assistant μπορεί να ρυθμιστεί για να επεξεργαστεί απευθείας ερωτήσεις φυσικής γλώσσας ή να απαντήσει σε ερωτήματα μέσω του τηλεφώνου.

Στο Watson, η IBM έχει δημιουργήσει μια πλούσια σε χαρακτηριστικά πλατφόρμα επεξεργασίας φυσικής γλώσσας. (Πιστωτική εικόνα: IBM)

Ο Watson συνεργάζεται με ζωντανό ήχο σε 11 γλώσσες και μπορεί να εισάγει ήχους σε μια ποικιλία προ-εγγεγραμμένων μορφών. Κατά τη ροή δεδομένων, η διαγνωστική υποστήριξη σε πραγματικό χρόνο σημαίνει ότι ο Watson μπορεί να ζητήσει από τους χρήστες να προσεγγίσουν το μικρόφωνο τους ή να αλλάξουν το περιβάλλον τους. Επίσης εντυπωσιακό είναι το γεγονός ότι ο Watson μπορεί να κάνει διάκριση μεταξύ διαφορετικών ομιλητών σε μια κοινή συνομιλία χάρη στο Speaker Diarization, ένα χαρακτηριστικό που υπόκειται ακόμη σε δοκιμές beta.

Watson Ομιλία σε κείμενο: Ρύθμιση

Για να χρησιμοποιήσετε τη Watson, το πρώτο πράγμα που πρέπει να κάνετε είναι να δημιουργήσετε έναν λογαριασμό IBM Bluemix. Η εγγραφή είναι δωρεάν και ανώδυνη, απαιτώντας απλώς μια διεύθυνση ηλεκτρονικού ταχυδρομείου και έναν κωδικό πρόσβασης. Αφού συνδεθείτε, πρέπει να προσθέσετε μια διάταξη στον λογαριασμό σας για την υπηρεσία Ομιλία σε κείμενο. Σε αυτό το στάδιο θα σας δοθούν μερικά διαπιστευτήρια που θα πρέπει να αποθηκεύσετε στα δικά σας αρχεία.

Η εγγραφή για λογαριασμό IBM Bluemix είναι απαραίτητη για να αποκτήσετε πρόσβαση στο πλήρες σύνολο λειτουργιών της Watson. (Πιστωτική εικόνα: IBM)

Αφού το κάνετε αυτό, τα πράγματα γίνονται πολύ πιο πολύπλοκα. Για να αποκτήσετε πρόσβαση στο Watson, θα πρέπει να προσθέσετε αυτά τα διαπιστευτήρια σε μια παρτίδα κωδικού εντοπισμού πόρου (cURL) πελάτη και στη συνέχεια να το εκτελέσετε στο μηχάνημά σας. Για να μάθετε ακριβώς ποια εντολή καλείτε, ανατρέξτε σε αυτόν τον εύχρηστο οδηγό. Εναλλακτικά, εάν θέλετε απλά να δείτε πόσο καλά λειτουργεί το σύστημα Watson χωρίς να χρειαστεί να μεταβείτε σε όλες αυτές τις στεφάνες, μπορείτε να το δοκιμάσετε στο demo site της IBM.

Διαβάστε επίσης  Οδοντιατρική αναθεώρηση Curve

Watson Ομιλία σε κείμενο: Διεπαφή

Σε αντίθεση με τις εφαρμογές φωνής-προς-κείμενο που απευθύνονται στους καταναλωτές, οι υπηρεσίες της Watson έχουν σχεδιαστεί για να έχουν πρόσβαση μέσω API και κώδικα ενσωματωμένο σε άλλα συστήματα. Για το λόγο αυτό, δεν υπάρχει πραγματικός Watson “διεπαφή”. Αντ ‘αυτού, η πρόσβαση στο Watson γίνεται μέσω τριών διαφορετικών πρωτοκόλλων Διαδικτύου. Αυτά είναι το WebSockets, το API REST και το Watson Developer Cloud.

Η Watson Speech to Text μπορεί να διαχειριστεί μέσω του συστήματος Cloud του Watson Developer. (Πιστωτική εικόνα: IBM)

Για να ελέγξετε τον Watson, θα χρειαστεί να χρησιμοποιήσετε ένα εργαλείο γραμμής εντολών που συνδέεται με το cloud της IBM μέσω μιας από αυτές τις τρεις διαδρομές. Η διεπαφή που βλέπει ο τελικός χρήστης που αλληλεπιδρά με τον Watson θα χρειαστεί να κατασκευαστεί από κάποιον στην ομάδα ανάπτυξης ξεχωριστά.

Watson Ομιλία σε Κείμενο: Απόδοση

Συνολικά, μας εντυπωσίασε ο τρόπος με τον οποίο αυτή η πλατφόρμα επεξεργασίας φυσικής γλώσσας χειρίστηκε πραγματική ομιλία. Χρησιμοποιήσαμε τον Watson για να μεταγράψουμε κλιπ που καταγράψαμε σε μια σειρά από δύσκολα περιβάλλοντα, καθώς και soundbites γνωστών ομιλιών που δόθηκαν σε πολλές από τις 11 υποστηριζόμενες γλώσσες του Watson.

Βρήκαμε ότι ο Watson είχε καλές επιδόσεις με προφορτισμένο λόγο. (Πιστωτική εικόνα: IBM)

Αν και τα σφάλματα έγιναν συχνότερα για κλιπ με μεγάλο θόρυβο, γενικά, ο Watson παρήγαγε απίστευτα ακριβή αποτελέσματα. Θα εκτιμούσαμε από τις δοκιμές μας ότι τα απρόβλεπτα λάθη εμφανίστηκαν μόνο μία φορά ανά 150 λέξεις κατά μέσο όρο. Ωστόσο, κατέστη σαφές γιατί το χαρακτηριστικό Speaker Diarization του Watson παραμένει στη δοκιμασία BETA καθώς αρκετές φορές κατά τη διάρκεια της αξιολόγησής μας η μία φωνή δεν αναδείχθηκε ως ξεχωριστοί ομιλητές.

Διαβάστε επίσης  Αναθεώρηση MyFico

Watson Ομιλία σε κείμενο: Υποστήριξη

Το κέντρο πόρων της IBM προσφέρει πολλές τεκμηρίωση για την καλύτερη κατανόηση του τρόπου εφαρμογής της Watson στην περίπτωσή σας. Αξίζει επίσης να αξιοποιηθούν οι ενσωματώσεις API και SDK που δημιουργήθηκαν από την κοινότητα προγραμματιστών Watson και δημοσιεύθηκαν στο GitHub.

Η σελίδα API GitHub του Watson είναι μια καλή πηγή υποστήριξης για την υπηρεσία Watson Speech to Text. (Πιστωτική εικόνα: IBM)

Αν δεν βρείτε τη λύση στο πρόβλημά σας, μπορείτε να επικοινωνήσετε άμεσα με την IBM ανοίγοντας ένα εισιτήριο υποστήριξης ή επικοινωνώντας μαζί τους μέσω του τηλεφώνου. Εφόσον επιλέξατε ένα από τα πακέτα υψηλής ποιότητας Watson, η χρήση της Watson θα προστατεύεται από συμφωνία επιπέδου εξυπηρέτησης επιπέδου υπηρεσιών.

Watson Ομιλία σε κείμενο: Τελική ετυμηγορία

Εάν ο οργανισμός σας διαθέτει την τεχνογνωσία και τους πόρους για να ενσωματώσει σωστά την πλατφόρμα IBM Watson Speech to Text στο σύστημά σας, θα επωφεληθείτε από προηγμένες λειτουργίες όπως διαγνωστικά ηχητικού περιβάλλοντος σε πραγματικό χρόνο και αποτελέσματα ενδιάμεσης μεταγραφής. Ωστόσο, οι μικρές επιχειρήσεις και οι οργανώσεις θα αγωνιστούν με την τεχνική πρόκληση της σωστής ρύθμισης του Watson.

Ο ανταγωνισμός

Η υπηρεσία IBM Watson Speech to Text είναι ένας άμεσος ανταγωνιστής στις υπηρεσίες μεταγραφής χύμα Google Cloud Speech-to-Text και Amazon Transcribe. Και τα δύο αυτά είναι σημαντικά φθηνότερα από τον Watson, με τη μεταγραφή του Google Cloud, για παράδειγμα, ξεκινώντας από 0,006 $ ανά λεπτό. Και οι τρεις υπηρεσίες μοιράζονται παρόμοιες λειτουργίες, όπως προσαρμοσμένο λεξιλόγιο, αλλά ένα χαρακτηριστικό που λείπει πολύ από την IBM Watson αλλά διατίθεται και με τους δύο ανταγωνιστές είναι η αυτόματη αναγνώριση στίξης.

Ψάχνετε για άλλη λύση που να υποστηρίζει κείμενο; Ανατρέξτε στον οδηγό μας Best word-to-text.

Αναθεώρηση Sony A7C

Ανακοινώθηκε τον Σεπτέμβριο του 2020, το Sony A7C κατέχει το βραβείο του μικρότερου και ελαφρύτερου συστήματος κάμερας πλήρους καρέ στον κόσμο. Στην ουσία, η...

Αναθεώρηση Samsung Galaxy Book Flex: ένας premium φορητός υπολογιστής Windows 2 σε 1

Με το Samsung Galaxy Book Flex, η Samsung σας προσφέρει καθημερινή υπολογιστική ισχύ σε μια συσκευή που ξεχωρίζει περισσότερο όσον αφορά το σχεδιασμό και...

Αναθεώρηση Fujifilm X-T30

Για εκείνους τους φωτογράφους που λαχταρούν το ρετρό στιλ - όσον αφορά τόσο το σχεδιασμό όσο και τη λειτουργία - οι φωτογραφικές μηχανές της...

Αναθεώρηση Nikon D5600

Με στόχο τους επίδοξους φωτογράφους, η αποτελεσματική ανάλυση D5600 των 24,2 megapixel της Nikon διαθέτει έναν τυπικό αισθητήρα μεγέθους APS-C της κατηγορίας, καθώς και...