67 γραμμές
5,5 KiB
Markdown
67 γραμμές
5,5 KiB
Markdown
|
+++
|
|||
|
title = 'Ελληνικά στο webglimpse/glimpse'
|
|||
|
date = '1999-04-01T00:00:00Z'
|
|||
|
description = ''
|
|||
|
author = 'Νίκος Μαυρογιαννόπουλος(mailto:nmav@hellug.gr)'
|
|||
|
issue = ['Magaz 14']
|
|||
|
issue_weight = 5
|
|||
|
+++
|
|||
|
----------------------------------------------------------------------------------------------------------------------------------------------------------------
|
|||
|
|
|||
|
*Τα προγράμματα glimpse/webglimpse αποτελούν τον πυρήνα μιας μηχανής αναζήτησης. Τo glimpseindex αναλαμβάνει το ρόλο της ταξινόμησης και δημιουργίας των αρχείων
|
|||
|
δεικτών (index files), ενώ το glimpse, την αναζήτηση σε αυτά. Το webglimpse είναι μια σειρά από scripts σε perl με σκοπό την εύκολη αναζήτηση από web. Η
|
|||
|
εγκατάσταση είναι σχετικά απλή αν ακολουθηθούν οι οδηγίες που περιέχονται στα πακέτα glimpse και webglimpse. (οι πιο πρόσφατες εκδόσεις βρίσκονται στο
|
|||
|
<http://glimpse.cs.arizona.edu> και <http://glimpse.cs.arizona.edu/webglimpse>*
|
|||
|
|
|||
|
----------------------------------------------------------------------------------------------------------------------------------------------------------------
|
|||
|
|
|||
|
To Glimpse σχεδιάστηκε και υλοποιήθηκε από τους Udi Manber, Sun Wu, και Burra Gopal στο πανεπιστήμιο της Αριζόνα, τμήμα πληροφορικής. Δεν είναι ελεύθερο
|
|||
|
λογισμικό αλλά η διανομή του για μη κερδοσκοπικούς σκοπούς επιτρέπεται. Για περισσότερες πληροφορίες κοιτάξτε το αρχείο COPYRIGHT μέσα στα tarball του glimpse.
|
|||
|
|
|||
|
Η υποστήριξη ελληνικών κατά την δημιουργία των αρχείων δεικτών καθώς και κατά την αναζήτηση παρ\' όλο που δεν αναφέρεται πουθενά, υπάρχει. Για να την
|
|||
|
ενεργοποιήσουμε πρέπει να αλλάξουμε στο Makefile κατά την μεταγλώττιση του glimpse την μεταβλητή ISO\_CHAR\_SET από 0 σε 1.
|
|||
|
|
|||
|
----------------------------------------------------------------------------------------------------------------------------------------------------------------
|
|||
|
|
|||
|
Δηλαδή την σειρά:
|
|||
|
ISO_CHAR_SET = 0
|
|||
|
σε
|
|||
|
ISO_CHAR_SET = 1
|
|||
|
|
|||
|
----------------------------------------------------------------------------------------------------------------------------------------------------------------
|
|||
|
|
|||
|
Η υποστήριξη αυτή βασίζεται στην δυνατότητα της libc να διαχωρίζει τους χαρακτήρες σύμφωνα με την χώρα που έχει δηλωθεί. Η δήλωση αυτή γίνεται μέσω της
|
|||
|
μεταβλητής περιβάλλοντος LC\_COLLATE (ή και LANG). Αρκεί λοιπόν πριν τρέξουμε τα glimpseindex και glimpse να θέσουμε LC\_COLLATE=el (ή gr\_GR για την libc5). Αν
|
|||
|
όλα πήγαν καλά στο αρχείο .glimpse\_index υπάρχουν και ελληνικοί χαρακτήρες-λέξεις.
|
|||
|
|
|||
|
Το webglimpse χρειάζεται επίσης μερικές αλλαγές για να μπορέσει να δεχτεί ελληνικούς χαρακτήρες χωρίς να τους απορρίψει. Αρχικά αλλάζουμε το αρχείο webglimpse
|
|||
|
στον cgi-bin κατάλογο.
|
|||
|
|
|||
|
----------------------------------------------------------------------------------------------------------------------------------------------------------------
|
|||
|
|
|||
|
Αναζητούμε την σειρά:
|
|||
|
$ENV{'PATH'} = '/bin:/usr/bin';
|
|||
|
και προσθέτουμε πριν από αυτήν:
|
|||
|
$ENV{'LC_COLLATE'} = 'el';
|
|||
|
|
|||
|
----------------------------------------------------------------------------------------------------------------------------------------------------------------
|
|||
|
|
|||
|
Προσοχή όχι
|
|||
|
|
|||
|
{'LANG'}= 'el';
|
|||
|
|
|||
|
γιατί με αυτόν τον τρόπο αλλάζουνεκαι οι ημερομηνίες που χρησιμοποιεί το webglimpse σε ελληνικά, με αποτέλεσμα να μην λειτουργεί καθόλου.\
|
|||
|
|
|||
|
----------------------------------------------------------------------------------------------------------------------------------------------------------------
|
|||
|
|
|||
|
Τώρα στο ίδιο αρχείο αναζητούμε την σειρά:
|
|||
|
&err_badquery if !$highlight;
|
|||
|
και την αλλάζουμε σε:
|
|||
|
#&err_badquery if !$highlight;
|
|||
|
|
|||
|
----------------------------------------------------------------------------------------------------------------------------------------------------------------
|
|||
|
|
|||
|
δηλαδή την βγάζουμε έξω τελείως, αφού αυτή δεν επιτρέπει την εισαγωγή ελληνικών στα πεδία. Επειδή δεν ξέρω perl δεν μπορώ να γνωρίζω τί ακριβώς έκανε αυτή η
|
|||
|
γραμμή. Αν κάποιος γνωρίζει καλό θα ήταν να μας διαφωτίσει.\
|
|||
|
Έτσι από το επόμενο query το webglimpse θα αναγνωρίσει και ελληνικούς χαρακτήρες χωρίς κανένα πρόβλημα!
|