Δευτέρα 17 Ιουνίου 2019

Αναζήτηση με τη χρήση μπαλαντέρ

Μπορείτε να χρησιμοποιήσετε χαρακτήρες μπαλαντέρ για να δημιουργήσετε μια κανονική έκφραση (regular expression) όταν θέλετε να εντοπίσετε μια ακολουθία χαρακτήρων σε ένα έγγραφο.

Για να κάνετε αναζήτηση με τη χρήση μπαλαντέρ:

  1. Εμφανίστε το πλαίσιο διαλόγου Εύρεση και Αντικατάσταση με ένα από τα επόμενα:
    • Στην καρτέλα Κεντρική κάνετε κλικ στο βελάκι επέκτασης του κουμπιού Εύρεση, στην ομάδα Επεξεργασία και στη συνέχεια επιλέξτε Πρόσθετα κριτήρια εύρεσης.
    • Στο πλαίσιο εργασιών Περιήγηση κάνετε κλικ στο εικονίδιο του φακού και στη συνέχεια επιλέξτε Πρόσθετα κριτήρια εύρεσης.
  2. Αν χρειάζεται κάνετε κλικ στο κουμπί Λεπτομέρειες, για να εμφανίσετε τις πρόσθετες επιλογές αναζήτησης.
  3. Ενεργοποιήστε την εντολή Χρήση χαρακτήρων μπαλαντέρ.
  4. Στο πεδίο Εύρεση του πληκτρολογήστε την έκφραση που θέλετε.

Ο επόμενος πίνακας περιγράφει τους χαρακτήρες μπαλαντέρ που μπορείτε να χρησιμοποιήσετε στις εκφράσεις αναζήτησης:

Πίνακας 1: Χαρακτήρες μπαλαντέρ για την εύρεση κειμένου

Ο χαρακτήρας βρίσκει... Εξήγηση - παραδείγματα
? Έναν οποιονδήποτε χαρακτήρα Το πο?ό βρίσκει ποσό, ποτό και ποσότητα.
* Οποιαδήποτε ακολουθία μηδενός, ενός, ή περισσοτέρων χαρακτήρων Το γη*ς βρίσκει γης, γηγενής αλλά και γηράσκω αεί διδασκόμενος.
[ ] Έναν από τους χαρακτήρες που βρίσκεται μέσα στις αγκύλες Το π[ιρ]ο βρίσκει πιο, προ και απροετοίμαστος.
[ - ] Οποιονδήποτε μεμονωμένο χαρακτήρα μεταξύ του εύρους των χαρακτήρων μέσα στις αγκύλες Το [π-σ]όδι βρίσκει πόδι και ρόδι. Οι χαρακτήρες μέσα στις αγκύλες πρέπει να είναι σε αύξουσα σειρά (δείτε το 1ο σχόλιο).
[ ! ] Οποιονδήποτε μεμονωμένο χαρακτήρα, εκτός από τους χαρακτήρες μέσα στις αγκύλες Το κά[!β]ο βρίσκει κάρο και κάδο, αλλά όχι κάβο.
[ !x-z ] Οποιοδήποτε μεμονωμένο χαρακτήρα, εκτός από τους χαρακτήρες της περιοχής μέσα στις αγκύλες Το [!δ-π]όδι βρίσκει βόδι και ρόδι, αλλά όχι πόδι.
{ n } Ακριβώς n εμφανίσεις του χαρακτήρα ή της παράστασης που προηγείται από τα άγκιστρα Το καμ{2}ία βρίσκει καμμία αλλά όχι καμία.
{ n, } Τουλάχιστον n εμφανίσεις του χαρακτήρα ή της παράστασης που προηγείται από τα άγκιστρα Το καμ{1,}ία βρίσκει το καμία και καμμία (δείτε το 2ο σχόλιο).
{ n,m }Από n έως m εμφανίσεις του χαρακτήρα ή της παράστασης που προηγείται από τα άγκιστρα Το 10{1,3} βρίσκει 10, 100 και 1000 αλλά και το 1 με τα τρία πρώτα μηδενικά στο 1000000 (δείτε το 2ο σχόλιο).
@ Μία ή περισσότερες εμφανίσεις του προηγούμενου χαρακτήρα ή παράστασης Το 10@ βρίσκει 10, 100, 1000, 1000000
< Την αρχή μιας λέξης Το <(αποθ) βρίσκει αποθήκη, αλλά όχι εναποθέτω
> Το τέλος μιας λέξης Το (αυτό)> βρίσκει αυτό και καυτό, αλλά όχι αυτόματο

Σχόλια

1.
Οι χαρακτήρες (εννοώντας όχι μόνο τα γράμματα, αλλά και τα σύμβολα, τα σημεία στίξης και άλλους ειδικούς χαρακτήρες), ταξινομούνται βάσει του αύξοντος αριθμού, ή καλύτερα, του κωδικού που έχουν στους πίνακες χαρακτήρων. Έτσι, στον πίνακα χαρακτήρων Unicode, που είναι ο πιο πρόσφατος και πιο ενημερωμένος, το γράμμα Π κεφαλαίο έχει κωδικό 0386 (902 σε δεκαδική μορφή) ενώ το π μικρό έχει κωδικό 03C0 (960). Για να βρείτε τον κωδικό ενός χαρακτήρα δείτε τους πίνακες χαρακτήρων ASCII και Windows-1253 (ο δεύτερος καλύπτει και τους κωδικούς των πινάκων Unicode για το ελληνικό μονοτονικό αλφάβητο).

2.
Το κόμμα μέσα στα άγκιστρα συμβολίζει το διαχωριστικό λίστας και εξαρτάται από τον χαρακτήρα που αναγνωρίζουν τα Windows, σύμφωνα με τις Τοπικές ρυθμίσεις στον Πίνακα ελέγχου. Συνήθως αυτός ο χαρακτήρας είναι το κόμμα (,) ή η αγγλική άνω τελεία (;)

3.
Αν παρατηρήσετε το πλαίσιο διαλόγου Εύρεση και Αντικατάσταση, μόλις ενεργοποιείτε την εντολή Χρήση χαρακτήρων μπαλαντέρ, παύουν να είναι διαθέσιμες οι εντολές Ταίριασμα πεζών - κεφαλαίων και Εύρεση ολόκληρων λέξεων. Πολλά άρθρα (ακόμα και της Microsoft) αναφέρουν ότι αυτό συμβαίνει γιατί με τη χρήση μπαλαντέρ οι εντολές αυτές θεωρούνται εκ προεπιλογής ενεργοποιημένες, που εγώ με τη σειρά μου ερμηνεύω ότι, η αναζήτηση με μπαλαντέρ περιορίζεται μόνο σε ολόκληρες λέξεις. Αν η ερμηνεία μου είναι σωστή, τότε η αιτιολόγηση της Microsoft είναι λάθος, ή για την ακρίβεια είναι η μισή αλήθεια, γιατί ισχύει μεν ο περιορισμός για τα πεζά - κεφαλαία, αλλά όχι για ολόκληρες τις λέξεις. Σ' αυτό το σημείο, το μόνο που ενδιαφέρει το Word είναι να εντοπίσει μια ακολουθία χαρακτήρων που θα πληρεί τις προϋποθέσεις που ορίζουν οι χαρακτήρες μπαλαντέρ. Π.χ. η αναζήτηση για π*α "λέει" στο Word να βρει το "π" που ακολουθείται από μία σειρά χαρακτήρων και σταματά στο "α", ασχέτως αν το "π" είναι το πρώτο γράμμα της λέξης και το "α" είναι το τελευταίο. Γι' αυτό επισημαίνει το πράγμα (παραβλέπει το πρώτο "α" επειδή είναι τονισμένο) αλλά και το πράγματα (σταματά στο πρώτο άτονο "α" που ικανοποιεί τα κριτήρια αναζήτησης αδιαφορώντας για το ότι θα μπορούσε να επισημάνει και το υπόλοιπο μέρος ώστε να καλύψει ολόκληρη τη λέξη). Και ακόμα πιο μακριά: Η αναζήτηση για χ*α θα επισημάνει χάρτινο το φεγγαράκι, που είμαι σίγουρος ότι δεν είναι λέξη!

4.
Αν θέλετε να εντοπίσετε έναν από τους χαρακτήρες που έχουν ειδική σημασία στις αναζητήσεις με μπαλαντέρ, π.χ. να βρείτε ένα αγγλικό ερωτηματικό (?) θα πρέπει να χρησιμοποιήσετε την ανάποδη κάθετο πριν από αυτό: [\?]. Η ανάποδη κάθετος λέγεται χαρακτήρας διαφυγής (escape) και αναιρεί την ειδική σημασία του χαρακτήρα που την ακολουθεί σε μια αναζήτηση με μπαλαντέρ. Παρόμοια, αν θέλετε να εντοπίσετε μία ανάποδη κάθετο μέσα στο έγγραφο θα πρέπει να πληκτρολογήσετε άλλη μία ανάποδη κάθετο πριν από αυτή [\\]. Ειδικά όμως, για την αναζήτηση ενός χαρακτήρα βέλους (^) δεν θα χρησιμοποιήσετε την ανάποδη κάθετο αλλά άλλον ένα χαρακτήρα βέλους [^^].

Οι χαρακτήρες με ειδική σημασία που παρακρατούνται από το Word για την αναζήτηση με μπαλαντέρ είναι: ( ) [ ] { } < > - @ ? ! \ ^.

5.
Στην αναζήτηση με χαρακτήρες μπαλαντέρ δεν μπορείτε να αναζητήσετε ένα χαρακτήρα παραγράφου () χρησιμοποιώντας το σύμβολο ^p. Αντ' αυτού χρησιμοποιήστε τον κωδικό του χαρακτήρα παραγράφου: ^13.

6.
Η χρήση A-z θα έπρεπε να εντοπίζει όλα τα γράμματα του αγγλικού αλφαβήτου, κεφαλαία και πεζά. Εκτός από αυτά όμως εντοπίζει και όλους τους χαρακτήρες μεταξύ των κωδικών 65 και 122, βάσει του πίνακα χαρακτήρων ASCII, όπου περιλαμβάνονται και οι χαρακτήρες [ ] ` ^ _ /. Για να εντοπίσετε μόνο τα γράμματα χρησιμοποιήστε A-Za-z.

Κατ' αντιστοιχία, το ελληνικό αλφάβητο βρίσκεται μεταξύ των κωδικών 0386 και 03CE βάσει του πίνακα χαρακτήρων Unicode, όπου παρεμβάλλεται η άνω τελεία (Unicode 0387). Επειδή όμως κανείς δεν χρησιμοποιεί άνω τελεία στο Word(!) μπορείτε να κάνετε αναζήτηση όλων των γραμμάτων (κεφαλαία-πεζά, τονισμένα-άτονα) χρησιμοποιώντας Ά-ώ. Αν επιμένετε ωστόσο να εξαιρέσετε την άνω τελεία, αντί Ά-ώ χρησιμοποιήστε ΆΈ-ώ.

7.
Κατά την αναζήτηση με τη χρήση χαρακτήρων μπαλαντέρ μπορείτε να χρησιμοποιήσετε ζεύγη παρενθέσεων για να χωρίσετε την έκφραση σε λογικές ομάδες. Αυτό είναι χρήσιμο όταν θέλετε να αντικαταστήσετε το κείμενο που αναζητάτε. Π.χ. Αν αναζητήσετε (Γεώργιος) (Γεωργίου) μπορείτε να ορίσετε αντικατάσταση \2 \1 για να αντιμεταθέσετε το όνομα και το επίθετο (να γίνει στο έγγραφο Γεωργίου Γεώργιος).

Σύνοψη
Θέμα
Αναζήτηση με τη χρήση μπαλαντέρ
Κείμενο
Γιώργος ο Αδαής
Συμβολή

– Ενσωματωμένα αρχεία Βοήθειας του Word

Ταυτότητα
1.01.040/0062
Έκδοση
4/10/10
Αναθεώρηση
17/6/19

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου