1 16 package com.blandware.atleap.search.analysis; 17 18 import org.apache.lucene.analysis.Analyzer; 19 import org.apache.lucene.analysis.TokenStream; 20 import org.apache.lucene.analysis.snowball.SnowballAnalyzer; 21 22 import java.io.Reader ; 23 24 32 public class PortugueseAnalyzer extends Analyzer { 33 34 private static SnowballAnalyzer analyzer; 35 36 private String PORTUGUESE_STOP_WORDS[] = { 37 38 "a", "ainda", "alem", "ambas", "ambos", "antes", 39 "ao", "aonde", "aos", "apos", "aquele", "aqueles", 40 "as", "assim", "com", "como", "contra", "contudo", 41 "cuja", "cujas", "cujo", "cujos", "da", "das", "de", 42 "dela", "dele", "deles", "demais", "depois", "desde", 43 "desta", "deste", "dispoe", "dispoem", "diversa", 44 "diversas", "diversos", "do", "dos", "durante", "e", 45 "ela", "elas", "ele", "eles", "em", "entao", "entre", 46 "essa", "essas", "esse", "esses", "esta", "estas", 47 "este", "estes", "ha", "isso", "isto", "logo", "mais", 48 "mas", "mediante", "menos", "mesma", "mesmas", "mesmo", 49 "mesmos", "na", "nas", "nao", "nas", "nem", "nesse", "neste", 50 "nos", "o", "os", "ou", "outra", "outras", "outro", "outros", 51 "pelas", "pelas", "pelo", "pelos", "perante", "pois", "por", 52 "porque", "portanto", "proprio", "propios", "quais", "qual", 53 "qualquer", "quando", "quanto", "que", "quem", "quer", "se", 54 "seja", "sem", "sendo", "seu", "seus", "sob", "sobre", "sua", 55 "suas", "tal", "tambem", "teu", "teus", "toda", "todas", "todo", 56 "todos", "tua", "tuas", "tudo", "um", "uma", "umas", "uns"}; 57 58 61 public PortugueseAnalyzer() { 62 analyzer = new SnowballAnalyzer("Portuguese", PORTUGUESE_STOP_WORDS); 63 } 64 65 public PortugueseAnalyzer(String stopWords[]) { 66 analyzer = new SnowballAnalyzer("Portuguese", stopWords); 67 } 68 69 public TokenStream tokenStream(String fieldName, Reader reader) { 70 return analyzer.tokenStream(fieldName, reader); 71 } 72 } 73 | Popular Tags |