Feeds:
Posts
Comentários

Posts Tagged ‘busca’

Google contra piratas


O Google anunciou que vai baixar a relevância de sites ilegais em seus resultados. Na prática isso quer dizer que os sites ilegais serão jogados para o fim da lista em vez de aparecer no topo como acontece em muitos casos. Além disso, sites que tenham sido denunciados como ilegais pelas leis americanas serão removidos dos resultados. Nesse caso, Google mostrará o texto da denúncia em vez do link para o site enquadrado. A ideia é inibir a pirataria, mas sinceramente a eficácia da medida deve ser mínima, pois há várias maneiras de contornar as barreiras levantadas pelo Grande Irmão. Vamos exemplificar:

Digitando Batman ressurge no Google receberemos uma lista encabeçada por sites de boa índole. Se acrescentarmos uma palavra na busca digitando Batman ressurge download o resultado muda radicalmente e traz uma penca de sites suspeitos que oferecem download do filme. Diz o bom senso que um filme em exibição nas salas de cinema não pode ser encontrado para download legalizado. Mesmo que o Google baixe a relevância dos sites de pirataria eles vão aparecer no topo quando não há alternativa legalizada para a pesquisa. Quanto aos sites removidos, o usuário pode clicar na denúncia e ver o endereço do site denunciado. Se o usuário buscar por um filme mais antigo como Batman Begins, o Google mesmo vai sugerir o argumento Batman Begins download.

A iniciativa antipirataria do Google pode parecer bobinha aos combativos defensores da difusão cultural gratuita, mas temos que vê-la como primeiro passo de um cerco que vai se fechar aos poucos. Em algum momento no futuro os sites de pirataria serão removidos dos resultados do Google pra valer. No começo, os clientes da pirataria vão dar risada do sumiço porque sabem como acessar o endereço diretamente sem ajuda do buscador. Com o tempo, porém, esses endereços conhecidos  podem ser fechados pela justiça e os novos que vão surgindo não serão apresentados no Google. Vamos migrar para outro buscador! dirão os inconformados. O problema é que todos os grandes buscadores vão ser pressionados a boicotar a pirataria. Vamos para buscadores mambembes então! Tudo bem, mas buscadores nanicos não têm o alcance de um Google e podem enfrentar problemas com a justiça. Vamos comprar DVD no camelô da esquina,. gente! Nessa hora alguém vai dizer: Como? Usar mídia física? Cai fora, meu. Muitos podem rir do que vou dizer mas acredito que a vida dos piratas vai ficar gradativamente mais complicada. Isso não quer dizer que a pirataria vai desaparecer, mas que pode ficar inviável em muitos casos.

O Google sempre manteve uma posição agnóstica em relação à pirataria. Eles não queriam ser antipáticos com o usuário, mas não há como negar que essa visão liberal do Google é um dos pilares que sustentam a pirataria. Alguns podem alegar que é um absurdo baixar a relevância de sites piratas porque um buscador tem como missão encontrar o que o usuário deseja. Segundo esses xiitas da liberdade absoluta o acesso à pirataria é um direito inalienável do usuário. Tenho minhas dúvidas. Ainda defendo a tese de que pirataria é refresco até o dia em que você é pirateado. Agora que o Google dominou o mundo, vai começar a atuar como líder monopolista. Qual será seu próximo passo contra a pirataria? E como os piratas vão contra atacar? Que prossiga a eterna luta do bem contra o mal.

Anúncios

Read Full Post »


No meu tempo de estudante pesquisa se fazia na biblioteca. Meus filhos fazem pesquisas na Internet. Eles vão à biblioteca também, mas no geral usam bem mais a informação digital do que a celulósica. Para pesquisar à moda antiga era preciso desenvolver algumas habilidades que lentamente podem desaparecer nas novas gerações. Está certo que outras habilidades substituirão as antigas e farão a diferença na vida do cidadão digital bem-sucedido. Ouso dizer, porém, que estas novas habilidades não se comparam às exigidas no passado por uma razão simples: os mecanismos de busca digital estão programados para compensar boa parte das deficiências do pesquisador. Vamos fazer um comparativo entre pesquisa tradicional e digital para explicar melhor o que quero dizer.

Profundidade e natureza. Digamos que eu quisesse pesquisar sobre o arquiteto Oscar Niemeyer. A primeira etapa da pesquisa envolve decidir que tipo de informação eu quero sobre o arquiteto. Seria uma biografia básica, uma análise de suas ideias ou o interesse estaria na obra arquitetônica dele? Estamos falando do nível de profundidade e da natureza da informação buscada. Se eu fosse à biblioteca pública e tivesse a sorte de ser atendido por uma bibliotecária ideal, ela perceberia com algumas poucas perguntas a minha necessidade e me indicaria algumas obras certeiras. Na Internet, eu recorreria a um buscador como o Google, que ainda não é uma bibliotecária ideal. Google conhece um pouco sobre o meu perfil, afinal ele armazena o meu histórico de buscas, mas creio que ainda não chegou ao ponto de me dar indicações matadoras como as da bibliotecária ideal. Em buscas mais específicas talvez, nem a bibliotecária ideal conseguisse me ajudar. Restaria a mim, me enfronhar no meio das estantes e procurar por conta própria obra a obra para fazer a triagem preliminar de natureza e profundidade. Da mesma forma, na pesquisa digital, é preciso vasculhar os endereços sozinho. Em resumo: a capacidade de discernir natureza e profundidade continua necessária, mais no computador do que na biblioteca.

Ordem alfabética. Na biblioteca, assim como em quase todos os lugares onde a informação é organizada, usa-se a ordem alfabética. Para ver se o acervo da biblioteca dispõe de determinado livro, basta consultar o fichário que está organizado alfabeticamente. Outras listas como a telefônica, o dicionário e a enciclopédia também usam a neutra e democrática ordem alfabética. Quem quiser encontrar dados nessas fontes tem que saber pesquisar pelo abc. Na Internet, essa habilidade tem valor reduzido, pois os mecanismos de busca varrem a lista pelo usuário.

Áreas do conhecimento. Para encontrar livros sobre Oscar Niemeyer na biblioteca eu poderia me orientar da seguinte maneira: uma biografia rápida eu encontro em enciclopédias que ficam na sala de obras de referência. Para pesquisar sobre suas criações, tenho que ir à estante de Arquitetura que fica na sala de Arte. A pesquisa na biblioteca fica mais ágil, caso eu tenha na cabeça a maneira como os bibliotecários organizam as estantes. Sabe-se que eles organizam os livros por áreas de conhecimento. Na Internet, pouco se usa a organização em áreas. O modelo digite aqui o que procura é predominante. De certa forma, os mecanismos digitais de busca incorporam a organização em áreas porque ao pesquisar Oscar Niemeyer recebo uma sugestão de busca por Arquitetura.

Palavras-chave. Na biblioteca, não se usa palavras chave. Conversamos com a bibliotecária ideal usando frases em linguagem natural e caso ela não consiga encontrar resultados, bastam algumas perguntinhas espertas dela para saber exatamente o que desejamos. Na Internet, tratamos com um frio computador de alta potência e o sucesso da busca depende da qualidade das palavras-chave que digitamos. O domínio da arte de fazer perguntas corretas ao computador é, portanto uma habilidade nova desconhecida nos tempos da biblioteca tradicional. Os sistemas de busca têm investido bastante no sentido de melhorar a relação com o usuário. Se o usuário comete um pequeno erro ortográfico na digitação do seu argumento de busca, o Google gentilmente, nos pergunta: Você quis dizer …? Digitamos uma palavra e Grande Irmão nos sugere outros temas relacionados com aquela palavra. É o Google tentando se transformar em bibliotecária ideal. Quem sabe, com todo esse investimento em tecnologia de busca, até o domínio das palavras-chave se torne uma habilidade obsoleta.

As pesquisas digitais podem nos levar a à perda de algumas habilidades, mas não há o que lamentar. Quem precisa saber calcular uma raiz quadrada na ponta do lápis nos dias de hoje? Só o engenheiro que trabalha na fábrica de calculadoras. Quem precisa dominar a arte da pesquisa? A bibliotecária ideal, que veste um tailleur impecável para suas medidas 90 60 90 e trabalha no Google.

Read Full Post »

Google do seu jeito


Os usuários agora podem personalizar a página inicial do Google. É a mudança mais radical na interface do Grande Oráculo desde seu lançamento há mais de doze anos. A personalização é básica. O que o usuário pode fazer é colocar uma imagem de fundo na interface. Dizem que essa novidade é inveja do Bing que conta com belas imagens de fundo na página inicial há mais tempo, mas para ser franco, a busca do Bing continua bem melhor em termos de design que a do Google.

O fato é que as páginas de busca do Google nunca tiveram design. Chamar o design do Google de minimalista seria um elogio sem merecimento. Faz doze anos que o serviço de busca adota uma linha espartana que prioriza acima de tudo o tempo de reposta. Aos poucos, muito aos poucos, essa linha está mudando, talvez por pressão da concorrência ou do usuário. Página inicial do Google é como caixa de Maizena. Trata-se de produto líder de mercado e, por isso, qualquer mudança de aspecto ou funcionalidade só é feita muito gradualmente depois de infindáveis testes e estudos.

A interface personalizada só está disponível para usuários Google, o que é compreensível, afinal a possibilidade de personalizar a página é um chamariz. O que o Google quer mesmo é que os usuários façam suas pesquisas logados. Assim, é possível ampliar a oferta de serviços como os resultados favoritos e o histórico de buscas. Esses dias fui olhar meu histórico de buscas no Grande Irmão. É impressionante, está tudo registrado: palavras buscadas, resultados clicados, data e hora. Está claro que isso é só o começo de uma ligação mais forte entre o usuário e o Google. Há riscos nessa promiscuidade? Não vou dar uma de profeta do apocalipse. Se essa proximidade me trouxer vantagens, por que não fazer uso dela? O meu banco sabe tudo sobre meus gastos e a companhia telefônica sabe para quem eu ligo. Por que o buscador não pode saber o que eu pesquiso, desde que não utilize essas informações para fins escusos?

Pode crer que o Grande Oráculo fará de tudo para aprofundar cada vez mais a relação com seus usuários ávidos por respostas. Já notou como a cada dia mais pessoas dizem: pergunte ao Google. Google não tem respostas, ele apenas as localiza, mas chegará o dia em que ele saberá mais sobre você do que a sua mãe ou qualquer pessoa do seu círculo de convívio.

Read Full Post »


resposta

Estamos entrando na era da Web 3.0, também chamada de Web semântica. Uma área que vai avançar muito nessa nova fase da Internet é a dos sistemas de respostas. Diferente de um sistema de busca, que fornece endereços, o sistema de respostas responde diretamente as perguntas do usuário. Já existem sistemas de resposta disponíveis na praça como o Answers.com. No Answers o usuário digita um assunto e recebe textos extraídos de fontes populares como Wikipedia ou Oxford Press. O serviço prestado pelo Answers é o de organizar a informação para o usuário, poupando-o de visitar site por site coletando os dados que precisa. A relevância de um serviço como esse é discutível, pois apenas queima uma etapa da pesquisa e deixa a cargo do sistema a seleção das fontes. Mas não vamos tirar o mérito dessa iniciativa que pode ser prática para pessoas que querem apenas uma resposta básica sobre assuntos do senso comum. Outros sistemas de resposta estão em desenvolvimento e prometem ir além com recursos avançados de semântica para dar respostas a perguntas complexas. Um exemplo nessa linha é o Webscalers da Universidade de Binghamton, outro é o Wolfram da Universidade de Harvard.

O que me preocupa nos sistemas de resposta é o modelo suicida que eles adotam. Esses sistemas não respondem às perguntas por si, recorrem a fontes da Internet. O que eles fazem é um trabalho de interpretação, pesquisa, classificação, filtragem e síntese, o que não é pouco. Em outras palavras, eles atuam como se fossem um ser humano que pesquisa na Internet e processa os dados até chegar a uma boa síntese. Como se vê, os sistemas de resposta dependem de fontes de conteúdo. Quem publica conteúdo na Internet espera receber visitas, afinal, elas geram receita publicitária, assinaturas ou alguma outra forma de recompensa menos tangível como satisfação pessoal, prestígio e reconhecimento. Se os internautas passarem a usar maciçamente os sistemas de resposta, os sites de conteúdo deixarão de ser visitados por pessoas. Somente o robô indexador do sistema de respostas fará uma varredura periódica no site em busca dos conteúdos. Sem visitação, os conteudistas deixarão de atuar e o sistema de respostas perderá as fontes que são vitais à qualidade de suas respostas, ou seja, o sistema de respostas destrói a si mesmo.

Esse cenário apocalíptico de extinção das fontes de conteúdo provavelmente não vai acontecer porque o ecossistema da informação reage e se adapta, mas existe o perigo real de os sistemas de resposta se tornarem poderosos a ponto de subordinar os produtores de conteúdo às suas regras. Aí caímos naquela engrenagem de poder econômico velha conhecida da indústria cultural. Os sistemas de resposta atuam na distribuição da informação. Eles são intermediários entre quem consome e quem produz. Em um mundo ideal, o intermediário tem o valor justo e proporcional ao serviço que presta. No mundo real, porém, os intermediários costumam ter poder muito superior à importância do seu papel. Eles é que dão as cartas. Pensando bem, já vemos essa desproporção hoje no poder acumulado pelo Google. Até agora, o Google, que é administrado por gente esperta, não matou a galinha dos ovos de ouro. O Google leva os internautas até os sites de conteúdo, enquanto que os sistemas de respostas prometem fazer exatamente o contrário. O Google concentra um poder imenso, mas que poderá parecer nanico se um dia os sistemas de respostas assumirem o posto de Grande Oráculo Universal.

Read Full Post »


oraculo-de-delfos

Imagine que você quer saber dia, hora e local do próximo jogo do seu time de futebol. Não seria bom escrever no buscador de Internet uma pergunta simples como:
— Quero informações sobre o próximo jogo do Atlético Paranaense.
E receber uma resposta direta:
— O próximo jogo será contra o Coritiba, dia 25/04 às 16h na Arena da Baixada.
O dia em que isso acontecer, os buscadores deixarão de ser meros sistemas de busca para se tornarem oráculos da sabedoria do universo. Rezo para que esse dia nunca chegue. Prefiro o modelo atual em que o sistema de busca responde com endereços de Internet, pois buscadores nada mais são do que uma evolução da lista telefônica. O sistema de busca não tem que dar respostas e, sim, informar onde eu as encontro, da mesma forma que a lista telefônica não fechava negócios, apenas informava o número da loja. Não é o que pensa o pesquisador Weiyi Meng, da Universidade de Binghamton, nos EUA. Ele e sua equipe estão desenvolvendo um sistema de busca que fornece respostas em vez de endereços. O projeto da Universidade pode ser acompanhado no site Webscalers. Não sei até onde vai a ingenuidade do professor Meng, ou seria eu o ingênuo por não botar fé na viabilidade de uma proposta como esta? Acredito que para muitas consultas seja possível fornecer respostas em vez de endereços. A pergunta “quanto é 2 + 2?” pode ser respondida diretamente com uma razoável chance de êxito, mas a imensa maioria das perguntas admite respostas múltiplas, sem falar nas que pertencem ao reino das polêmicas emaranhadas e intransponíveis. Uma pergunta simples como “Quem descobriu o Brasil?” não é simples. Se você pensou em Pedro Álvares Cabral, com certeza, se lembrou das aulas de História do ensino fundamental, mas aqueles bons velhos tempos não voltam mais. Qual é o nível de profundidade que se espera dessa pergunta? O que é descobrimento? Houve outras viagens ao Brasil antes de Cabral vir demarcar essas terras como colônia portuguesa?
Se um sistema de respostas substituísse o sistema de busca os sites de Internet deixariam de ser visitados porque o usuário teria o que precisa no passo anterior à visita. Quem iria produzir conteúdo sem a perspectiva de receber visitas, exceto a dos robôs do Google? Como o ecossistema da informação equilibraria essa equação? Por fim, um sistema de respostas criaria uma perigosa ilusão de verdade suprema. Para que verificar fontes se o buscador já fez isso usando algoritmos idôneos? Quem iria definir esses algoritmos? Atualmente, já temos a caixa preta do ranqueamento do Google que coloca no topo da sua lista quem ele quiser. Imagine se um dia ele começar a dar respostas baseado na fonte que ele quiser. É incrível como algumas pessoas estão dispostas a depositar confiança bobina em sistemas cômodos, mas de alto risco. Bem, isso não é nenhuma novidade, afinal não são poucos os que dizem: li na Internet, logo é verdade.

Read Full Post »