Η Google άνοιξε το API για OCR
οι υπηρεσίες Web / / December 24, 2019
Ναι, εργάζονται στα βιβλία της Google σίγουρα φέρνουν καλά αποτελέσματα, μπορούμε να αρχίσουμε να αποκομίσουν. Και τώρα θα σας πω πώς.
Τα σαρωμένα έγγραφα δεν απαιτούν πάντα μια μετατροπή στο ίδιο το κείμενο. Αλλά μερικές φορές θέλει να μην κερδίσει και πάλι οποιαδήποτε συμφωνία, και ένα ηλεκτρονικό αντίγραφο του κάτι και όχι. Φυσικά, θα μπορούσατε να χρησιμοποιήσετε κάποιο φθηνό πρόγραμμα του OCR, πηγαίνει με το σαρωτή, ή ακόμα και να αγοράσετε αυτό (δεν σας κλέψουν) FineReader. Όμως, η ελεύθερη επιφάνεια εργασίας του λογισμικού OCR λειτουργεί, επίσης, γιατί τώρα τα κείμενα είναι όλο και περισσότερο να φωτογραφηθούν, να μην σαρωθεί.
Για να κατεβάσετε κανένα από φωτογραφίες (jpeg, png, gif) με αναγνώριση κειμένου για τα επόμενα API της Google και άνοιξε στα Έγγραφα Google. Τώρα μπορείτε να ανεβάσετε εικόνες σε μια βιβλιοθήκη εγγράφων, και ο server της Google θα το μετατρέψει σε κείμενο.
Υπάρχει επίσης ένα παράδειγμα εφαρμογής που δείχνει πώς το API:
Αλλά, οι προγραμματιστές θα πρέπει να σκεφτείτε για τη δημιουργία των δικών τους περιβάλλον σε αυτές τις δυνατότητες. Για παράδειγμα - έχετε τις σαρώσεις των βιβλίων σε PNG; Αυτή είναι μια διαστροφή, έτσι δεν είναι; Έτσι εκεί έχετε την κάρτα στο χέρι - γράψετε μια εφαρμογή που φορτώνει η σελίδα κειμένου από τη σελίδα, δεν παραβιάζει τα όρια και συνδέει το σύνολο του φορτίου σε ένα ενιαίο κείμενο.
Αλλά να θυμάστε, υπάρχουν περιορισμοί στο API, και το κυριότερο από αυτά, κατά τη γνώμη μου - κάτι που αναγνωρίζεται Λατινική μόνο μόλις. Επίσης, πρέπει να ληφθεί μέριμνα για το ύψος του χαρακτήρα δεν είναι μικρότερη από 10 pixels, και το συνολικό μέγεθος της εικόνας δεν υπερβαίνει τα 10 megapixels.