“Essas relações todas que se estabelecem entre orações, entre partes do texto, são essenciais para que a gente entenda os enunciados como sendo coerentes. Se não entendermos essas relações implícitas, não vamos entender o texto como coerente. Basicamente é isso que a RST estuda.”

 

Juliano Desiderato Antonio é formado em Letras pela Universidade Estadual de Londrina (UEL). É Mestre e Doutor em Linguística e Língua Portuguesa pela Universidade Estadual Paulista Júlio de Mesquita Filho, campus de Araraquara. Fez seu pós-doutorado também na Universidade Estadual Paulista Júlio de Mesquita, no ano de 2011, no campus de São José do Rio Preto. É docente na Universidade Estadual de Maringá desde 1997, atuando na graduação, na área de Linguística, e na pós-graduação, com foco no Funcionalismo. Entre suas publicações, organizou, em coautoria, o livro Gêneros textuais em contexto de vestibular (2017). Em evento promovido pelo O Consoante, Juliano Desiderato Antonio ministrou a entrevista-aula intitulada “A Teoria da Estrutura Retórica e a descrição de gêneros textuais”.

 

por Anna Clara Gobbi, Laura Galuch, Neil Franco e Priscila de Souza

 

O Consoante: Em linhas gerais, o que é a RST? É possível afirmar que sua constituição se dá pela convergência de outras teorias com enfoque nos aspectos formais e estruturais dos textos? Quando e como essa teoria começa a fazer parte de sua trajetória acadêmico-científica?

 

Antonio: O pressuposto básico é a ideia de que quando temos enunciados que se unem, que se juntam, não temos só um amontoado de orações. Temos relações implícitas, relações que não estão explicitadas e que ajudam a dar coerência ao texto. Vamos pegar um exemplo de um ditado popular: “Leite com manga, morre”. Qualquer falante de português, ao ver o enunciado, ao se deparar com um enunciado desses, vai identificar, não formalmente, não explicitamente, mas tacitamente, ou seja, vai reconhecer uma relação de condição: se você toma leite com manga, você vai morrer. Então entender esse enunciado como coerente passa por identificar esse tipo de relação que se estabelece entre esses enunciados todos, que se juntam para formar o texto. Quando se está andando na rua e se depara com um outdoor desses: “Use sal grosso. As outras carnes vão ficar com inveja”, qualquer falante que olhar para o outdoor vai ver que esse segundo enunciado apresenta uma justificativa, uma motivação. Existe aí o sal grosso enquanto elemento que é utilizado para salgar mesmo a carne do churrasco. Mas tem também aquela segunda leitura: da inveja e do mal olhado, porque o sal grosso evita mau olhado. Essas relações todas que se estabelecem entre orações, entre partes do texto, são essenciais para que a gente entenda os enunciados como sendo coerentes. Se não entendermos essas relações implícitas, não vamos entender o texto como coerente. Basicamente é isso que a RST estuda. Ela vai então além do conteúdo explícito que as orações veiculam, ela se preocupa com essas relações implícitas que surgem das relações que se estabelecem entre as partes do texto. Podemos chamar essas proposições de relações discursivas, relações de coerência, que é um termo mais geral, de relações retóricas, que é um termo mais específico da teoria. E quando falamos em retórico é no sentido organizacional, de organização do texto. A compreensão dos textos depende do reconhecimento dessas relações e elas permeiam o texto todo. Essa teoria surgiu no início dos anos 1980 na Universidade da Califórnia, numa tentativa de se criar um modelo que permitisse a geração automática de textos. Estas são as pessoas que deram início a teoria: Bill Mann, que era um engenheiro elétrico, dos anos 1960, que depois começou a se interessar por linguística e linguística computacional. Ele sentiu necessidade de pensar num modelo que servisse para geração automática de textos. Ele se reuniu com a Sandra Thompson, que é uma linguista norte-americana, bem conhecida no funcionalismo, e com o Christian Matthiessen, que é um linguista inglês, coautor nas gramáticas do Halliday, um dos grandes nomes do funcionalismo. E todo projeto de criar essa teoria que explicasse a formação dos textos e que permitisse depois a geração automática de textos tinha supervisão de Halliday. Inicialmente eles propuseram uma lista com pouco mais de vinte relações e os rótulos que eles propuseram estão aqui: elaboração, circunstância, solução, causa, resultado, propósito, condição, interpretação, meio, modo, avaliação, reafirmação, resumo, sequência, contraste, motivação, antítese, fundo, competência, evidência, justificativa, concessão e preparação. Depois eles chegaram a um número de 29, 30 mais ou menos. Mas o rol não é fechado. Quando se sente a necessidade, pode-se criar uma relação específica. Outros autores trabalham com mais de 100 relações, enfim, são rótulos que são dados. Vamos utilizar como exemplo a relação de elaboração. As relações são de dois tipos. Tem relações multinucleares, em que cada porção de texto é um núcleo distinto, em que uma não é ancilar da outra. É mais ou menos como se fosse uma relação entre uma oração adverbial e a sua oração nuclear. E a relação entre orações coordenadas. Mas isso não acontece só entre orações. Acontece, também, entre porções grandes do texto. A formalização das análises é feita por meio de diagramas arbóreos. Aí alguém pode dizer: “Ah mas parece gerativismo”. Parece, mas não tem nada a ver, só o formato que é parecido. A análise sintática feita pelo gerativismo é da sentença, e é formal. Ela levanta apenas aspectos formais. Aqui, a gente vai representar o diagrama, levando em conta aspectos pragmáticos, por exemplo, o efeito que o texto produz sobre o enunciatário, as funções que as porções do texto assumem para que se atinja o objetivo global para o qual foi produzido. Portanto, nesse ponto já posso adiantar que a RST é uma teoria pragmática, que leva em conta a intenção do produtor do texto, o que ele faz para atingir sucesso comunicativo. Van Dijk, grande referência da linguística, dizia que os falantes são capazes de sumarizar o conteúdo de um texto por meio dos tópicos principais daquele texto. Para ele, os discursos são organizados em torno de um núcleo semântico, que intuitivamente chamamos de tópico. Ainda para o autor, os tópicos discursivos são propriedades do sentido global do texto e propriedades necessárias para que o texto seja globalmente coerente. Há vários termos usados para definir a unidade central, mas aqui vamos utilizar “unidade central” mesmo, que é muito comum nas análises da RST. A RST veio da gramática sistêmico-funcional do Halliday. Por isso a RST traz muita coisa da gramática sistêmico-funcional, principalmente a estrutura núcleo-satélite e multinuclear, parte da teoria do Halliday.  As relações retóricas ou relações de coerência podem aparecer no texto sem ser sinalizadas. Não precisa ter nenhuma marca indicando a relação, porque as relações são de sentido não de forma e não tem um conector que sirva só para sinalizar uma relação, e uma relação que seja sinalizada só para aquele conector. Ao contrário daquilo que aprendemos na escola, quando aprendemos orações adverbiais. Por exemplo, como identificamos uma oração condicional? Pela conjunção “se”.  E uma oração temporal? Pelo “quando”. Isso pela gramática tradicional. A RST questiona isso. Muitas relações se estabelecem sem conector nenhum.  Terminando de responder à pergunta “Quando a gente começou a trabalhar com RST?”, podemos dizer que foi a partir desta afirmação de um texto do Cristian Matthiessen e da Sandra Thompson: “A combinação de orações reflete a estrutura organizacional dos textos”. Ou seja, se tem oração adverbial e oração nuclear e a relação núcleo-satélite, tem orações adversativas e relação multinuclear de contraste”. Assim, transformei o tema em tese de doutorado, investigando narrativas orais e narrativas escritas, vendo como essa organização, que está na macroestrutura do texto, se dá também na microestrutura. O corpus foi formado por narrativas orais e narrativas escritas recontadas. Passamos para os participantes um filme sem falas para não influenciar a formulação linguística. Eles assistiram, e depois pedimos que recontassem oralmente, gravando como se estivessem contando a história do filme para um amigo, e depois fizemos a transcrição alfabética e análise retórica. A ideia é sempre escrever com base em um gênero. No caso da pesquisa, foi utilizado o gênero narrativo para história recontada. Baseamo-nos na teoria do Labov e do Waletsky, que propõem uma estrutura para a narrativa. A narrativa começa com um fundo. Tem a parte principal, que é a complicação e a resolução. Na época eu chamei de background, mas poderia ter traduzido na época para “fundo”, relação de fundo. Essas sequências iniciais da narrativa são fundo para complicação que também tem suas ações em sequência. Depois tem as ações que trazem a resolução para essa complicação. Foi essa estrutura retórica que a gente foi analisando, mostrando que realmente tem essa organização tanto no nível macroestrutural núcleo, satélite ou multinuclear, vários núcleos juntos. Isso também acontece entre orações. A organização do texto se reflete na gramática.

 

OC: Em algumas pesquisas suas e de orientandos você passa a usar a RST para a descrição de gêneros textuais. Mesmo dando enfoque na organização textual dos gêneros, essas pesquisas consideram o contexto em que os textos foram produzidos?

Antonio: O contexto de produção é importante também porque a análise baseia-se em uma relação de plausibilidade. Na verdade, o analista que vai trabalhar com texto e fazer análise retórica tem acesso ao texto, tem conhecimento do contexto em que o texto produzido, das convenções culturais do produtor do texto, seus possíveis receptores, mas ele não tem acesso direto ao produtor do texto, ou seja, eu não posso entrar na cabeça de quem escreveu o texto pra dizer: “olha é essa relação aqui”. Nós dizemos que é uma análise de plausibilidade: é plausível que a relação aqui seja essa, é plausível que a intenção do autor do texto aqui tenha sido essa. Dizemos isso com base, portanto, em convenções culturais, contexto em que o texto foi produzido. Não fazemos distinção entre análise discursiva e análise textual. É importante dizer que fora do Brasil, qualquer lugar fora do Brasil, até mesmo na França, dependendo da universidade, se se fala em análise do discurso, ou discourse analysis, está se falando de linguística textual. Só no Brasil tem essa distinção. Porque aqui a análise discursiva de linha francesa pegou. Mesmo na França, na maioria dos lugares, se se falar em análise do discurso está se falando em linguística textual. Em alguns lugares específicos, algumas universidades, falar em análise do discurso é sim se referir àqueles filósofos franceses que embasam o que chamamos no Brasil de Análise do Discurso. Se pegarmos o livro discourse analysis, livro famoso de Brown e Yule, vamos ver que se trata de um livro de linguística textual. Poucos brasileiros conhecem um dos maiores filósofos brasileiros contemporâneos, que morreu recentemente. Ele dava aula em Israel. Marcelo Dascal era professor da Unicamp e foi contratado pela universidade de Tel Aviv. Ele escreveu um texto chamado Models of interpretation, em que apresenta a metáfora do iceberg. Ele mostra que todas as teorias, na verdade, estão em busca de sentido. Dascal assim afirma: “O ser humano por natureza é um caçador de sentidos”. Nós sempre partimos do pressuposto de que todo texto é coerente, do que o que outro falou é coerente. Só que cada modelo teórico vai procurar um sentido num lugar diferente. As teorias estruturalistas vão procurar na superfície mais perto, mas a gente sabe que o iceberg tem muito mais coisa, é muito maior para baixo da água do que para cima. Ele fala dessas teorias discursivas francesas, ele fala das teorias pragmáticas, que é onde entra a RST. Enfim, fala de todos os modelos de teoria em que cada uma vai buscar um sentido. Vale muito a pena ler seu texto [Models of interpretation]. Recomendo para todo mundo a leitura desse texto.  Dascal mostra exatamente, usando um iceberg como metáfora, onde cada um vai buscar o sentido. Vamos a um exemplo. É propaganda de uma academia de ginástica de Belo Horizonte. Na imagem há algo escrito na camiseta da moça: “Ju malha há dois anos, o marido dela não. Ju corre 20 minutos por dia, o marido dela não. Ju faz sexo três vezes por semana, o marido dela não.”. Esse é o texto que está na camiseta de uma moça, que está fazendo ginástica na academia. Vamos pensar então em convenções culturais, no contexto do texto produzido. Nós podemos pensar em duas análises a partir disso. Vamos primeiro analisar só do ponto de vista formal. O que se tem aqui formalmente? Temos três estruturas em paralelo, indicando o que a Ju faz e o marido não. Portanto, temos estruturas muito semelhantes. Temos uma relação de contraste multinuclear, um núcleo não é mais importante do que o outro. E temos uma lista de três ações. Um paralelismo sintático. Essa seria uma leitura ingênua, uma interpretação literal. E se levarmos em conta o contexto em que foi produzido, as convenções culturais, a intenção do produtor do texto? Será que essa análise aqui é fiel ao que o produtor do texto quis fazer? Observem. Vivemos numa sociedade que valoriza muito o corpo. Todo mundo vai para academia e muitas vezes não é para ter saúde. Uma pesquisa recente apontou que mais de 70% das pessoas frequentam academia para ter um corpo bem definido, um corpo para conseguir transar, para conseguir sexo. Ou seja, a inferência que podemos fazer é que ela [a Ju] tem um corpo bonito, bem definido, um corpo malhado, o marido dela não. Qual é o resultado disso? Ela faz sexo três vezes por semana. E ele? O que procuramos, muitas vezes, para evitar problemas de análises discrepantes, é fazer com que várias pessoas anotem o mesmo corpus. Três ou quatro pessoas fazem a anotação do corpus. E a partir daí, quem é responsável por aquela pesquisa vai fazer uma validação dessas análises para chegar a uma análise que seja, talvez, a mais plausível. Porque, realmente, vão aparecer diferenças nas análises. As pessoas pensam de maneiras diferentes. Cada vez que se lê um texto, cada pessoa que lê um texto vai interpretar o texto de maneira diferente a partir das experiências que tem. As experiências de mundo que tem, das leituras que tem. Costumamos fazer passar corpus pela análise de três ou quatro pessoas para conseguir chegar ao denominador comum. A primeira coisa que fazemos é tentar identificar a unidade central. A hora que todo mundo está afinado, busca-se analisar as outras partes do texto para evitar discrepância. Assim, com a discussão, conseguimos chegar a um denominador comum. Mas a análise, claro, acaba sendo subjetiva. Levamos em consideração as intenções do produtor do texto, que gênero ele está produzindo, com que finalidade. Então, voltando ao exemplo, o da propaganda de academia. A intenção é que as pessoas frequentem a academia. E a recompensa por frequentar a academia vai ser conseguir sexo.

 

OC: Em que a RST poderia contribuir para a formação de professores? É possível transpor os procedimentos analíticos da RST como forma de contribuir para o trabalho do professor de línguas na escola?

Ao trabalhar em sala de aula, precisa-se partir e usar os princípios da teoria. O aluno, seja no ensino médio, seja na universidade, quer aprender a escrever; ele não quer aprender a analisar texto fazendo árvores. Podemos usar os princípios, basicamente a ideia de que todo texto tem um núcleo, de que ele será desenvolvido a partir desse núcleo, de que há diferentes maneiras de desenvolver as ideias do núcleo. Segundo a professora Maria Helena de Moura Neves, o ensino de língua, no viés funcionalista, objetiva o desenvolvimento da competência comunicativa no aluno (não somente a competência linguística, a gramática), considerando-se que é na interação que se usa a linguagem e que se produzem textos. O foco é, portanto, a construção do sentido no texto e o cumprimento das funções da linguagem. Dentre essas funções da linguagem na interação, a argumentação talvez seja a mais característica, uma vez que falantes e ouvintes estão em jogo constante na expressão de suas subjetividades. A professora Neves sempre foi funcionalista, mesmo sem saber. Em sala de aula, ela deixava o livro aberto na mesa e trabalhava a função dos elementos linguísticos no texto. E, de certa forma, trabalhar a função dos elementos linguísticos no texto é ser funcionalista. Na visão funcionalista, a gente sempre leva em conta a produção de sentidos, como os elementos linguísticos agem na produção de sentidos. No modelo funcionalista, o ensino de gramática pressupõe que o aluno reflita sobre as escolhas que tem à sua disposição ao formular seus enunciados. A gramática apresenta uma série de possibilidades; o aluno vai escolher qual usar. No funcionalismo, o foco está em entender o porquê de o falante ter feito determinada escolha e se a escolha provocou um bom efeito, um efeito comunicativo adequado. Vale ressaltar que poucos materiais que existem nas escolas ensinam escrita; a maioria ensina gramática, teoria gramatical ou norma gramatical. Esse ensino não transforma ninguém em um exímio produtor de texto. Afinal, pode-se ser um bom teórico gramatical e não ser um bom produtor de texto. Do ponto de vista metodológico, a identificação da Unidade Central, doravante UC, é importante para o desenvolvimento de análises baseadas na RST. É um passo decisivo para a anotação da estrutura retórica de um texto. Qual é a vantagem dessa proposta? Produzir um texto conscientemente a partir do desenvolvimento da UC pode ser crucial para alunos que disputam uma vaga no ensino superior, seja por meio de concurso vestibular, seja por meio do Enem. Isso a fim de evitar que o texto fique uma bagunça. Do ponto de vista acadêmico, a identificação da UC é essencial para o treinamento das bancas de professores que realizam a avaliação de textos em concursos vestibulares e no Enem. De modo geral, a proposta é desenvolver o texto a partir da unidade central e apresentar mecanismos que ajudem nesse desenvolvimento. Para a elaboração prática da proposta, é possível elaborar material de produção textual para alunos de ensino médio; treinar bancas de avaliação de textos em exames de seleção para a universidade; criar aplicações automáticas para avaliação de textos.

OC: Você tem a experiência de quem contribuiu diretamente com a Comissão de Vestibular da UEM (CVU) no que se refere aos trabalhos com a redação de vestibular. Isso te motivou a orientar pesquisas com foco na descrição de gêneros textuais dos processos seletivos? Poderia citar algum resultado dessas pesquisas?

Para exemplificar, trouxe algumas propostas de resposta argumentativa (RA). Antes, porém, é necessário avaliar a existência do tópico frasal, já que é preciso partir do tópico frasal para desenvolver argumentos que sustentem a tese nele apresentada. Segundo Garcia (1996), “constituído habitualmente por um ou dois períodos curtos iniciais, o tópico frasal encerra de modo geral e conciso a idéia-núcleo do parágrafo” (GARCIA, 1996). A ideia, praticamente, coincide com a RST: apresenta-se a ideia central e, depois, desenvolve-a. Sobre a resposta argumentativa (RA), é um gênero que pertence à esfera escolar/acadêmica e faz parte de um processo de avaliação. Segundo Menegassi (2011), é iniciada pela retomada da pergunta seguida da resposta a essa pergunta, que é a tese defendida pelo autor. No restante do texto, o autor apresenta argumentos que dão suporte à tese na tentativa de convencer o leitor. Como exemplo, apresento a proposta do Vestibular de Verão de 2013, da Universidade Estadual de Maringá, cujo comando solicitava uma resposta à seguinte pergunta: “Qual é o segredo do vestibular: inteligência, esforço ou sorte?”. Analisando as redações, obtivemos as seguintes constatações: quando o candidato não desenvolveu o texto a partir de uma unidade central (UC), apresentou várias respostas à pergunta, comprometendo o desenvolvimento do texto, não atendendo ao solicitado pelo comando. Em outros casos, alguns candidatos apresentaram a afirmação inicial, mas não a desenvolveram ao longo do texto. Novamente, vemos a importância de trabalhamos a UC com os alunos, indicando a necessidade de apresentação de uma tese e de argumentos que a comprovem, ou seja, a apresentação do tópico frasal e de argumentos que o desenvolvam. Em algumas redações, notamos que os alunos indicaram um fator, mas, ao longo da argumentação, apresentaram os três – inteligência, esforço e sorte. Novamente, percebemos como faz falta o planejamento do texto a partir de uma UC. Já em outros casos, sequer é possível encontrar uma UC a ser desenvolvida. Não há uma unidade de sentido, mas vários enunciados soltos. Percebe-se, mais uma vez, como faz falta um trabalho que ensine o aluno a escrever de forma organizada. Por isso, a proposta de trabalhar a partir da UC. Para identificarmos a UC do texto, há os seguintes parâmetros: posição no texto; retomada da pergunta; vocábulos mais frequentes; presença de orações matriz com verbos evidenciais, os quais indicam a fonte da informação; presença de advérbios modalizadores. Analisando, ainda, os comandos do Vestibular de Inverno de 2009, cuja pergunta motivadora foi “A internet é nociva?”, e do Vestibular de Verão de 2014, cuja pergunta motivadora foi “Você é a favor OU contra o uso de animais em pesquisas científicas?”, identificamos as seguintes relações na UC: contraste, adição, condição, concessão, posição social, adjetivo predicativo que expressa o posicionamento do autor. Já para o desenvolvimento dos argumentos, as seguintes relações retóricas foram utilizadas: elaboração, contraste, justificativa, evidência, persuasão, concessão. Para comparação, foi analisada a proposta do Enem de 2013, cuja temática era o “Efeito da implantação da Lei Seca no Brasil”. Nos textos estudados, as relações utilizadas no desenvolvimento da UC foram estas: contraste, elaboração, causa-consequência, interpretação e adição. Comparando a RA e o texto dissertativo-argumentativo, identificamos que, no gênero RA, a UC ocorre em posição inicial em 90,7% dos textos. No texto dissertativo-argumentativo, a posição mais comum da UC é a porção que vai de 20% a 30% da extensão do texto, ou seja, no fim da introdução, antes do desenvolvimento. Essa diferença organizacional entre o gênero RA e o texto dissertativo-argumentativo pode ser explicada a partir de diferenças nas condições de produção. No gênero RA, o produtor deve iniciar seu texto respondendo à pergunta que o motivou. Por outro lado, no texto dissertativo-argumentativo, é necessária a criação de um pano de fundo com informações que situem o destinatário do texto com relação à temática.

OC: É possível, pela RST, a descrição dos chamados gêneros orais: quais são os procedimentos de descrição para textos com base nesses gêneros?

Antonio: Há muita coisa interessante que dá para fazer em língua falada. Como essa pesquisa em que trabalhamos com as aulas de curso superior. Nós temos corpus de oito aulas, e essas oito aulas estão transcritas, são aulas de diversos cursos, aula de Matemática, de Educação física, Psicologia, Farmácia, Economia, enfim, são oito aulas que estão transcritas e fazem parte do banco de dados do nosso grupo de pesquisa. Por exemplo, em uma aula de físico-química do curso de Farmácia, identificamos um supertópico. O professor chegou, conversou com os alunos e fez todo aquele momento de “quebra de gelo”. E depois anunciou o supertópico da aula: suspensões. Depois desenvolveu esse supertópico na forma de cinco subtópicos por meio da relação de elaboração: definições das suspensões, homogeneidade da suspensão, liberação das suspensões, por que utilizar suspensões, aspectos físico-químicos das suspensões. Nos procedimentos, a primeira coisa é transcrever alfabeticamente. Usamos uma adaptação das regras do NURC. Usa-se o símbolo do jogo da velha caso não tenha entendido alguma coisa. Antigamente se usava gravador que era mais difícil. Hoje em dia, gravando no celular entende-se praticamente tudo. Coloca-se entre parênteses a hipótese do que ouviu, a barra para truncamento, a maiúscula para entonação enfática, dois pontos para prolongamento, o ponto final para entonação descendente de final de frase, a virgula para entonação estável indicando continuação, e as pausas, quanto mais pontos, maior a pausa. A segunda etapa é segmentar em unidades discursivas elementares, ou EDUs, que são blocos mínimos de construção de uma árvore discursiva. Geralmente correspondem a orações. Segmentamos em oração com exceção de oração completiva, que são as orações substantivas, e de orações restritivas, que não estabelecem nenhum tipo de relação retórica. Elas não estabelecem relação de sentido. Simplesmente funcionam como um complemento exigido pela oração principal. Fazem parte da estrutura da oração principal. Na fala, as EDUs são unidades de entonação, são um conjunto de palavras combinadas sob um único e coerente contorno entonacional, caracterizado por um ou mais picos entonacionais e uma cadência típica de final de oração ou de final de sentença, geralmente precedidas por uma pausa. Então tem uma pausa, tem geralmente a estrutura de uma oração, tem o contorno entonacional que caracteriza a cadência típica de final de oração. Nós podemos estudar as estratégias da língua falada. Tem muita coisa que o pessoal trata como se fosse defeito da língua falada. A professora Ingedore Koch fala sobre o pessoal querer analisar a fala com a gramática da escrita, mas são processos diferentes. Na fala estamos falando enquanto planejamos. Por exemplo, na fala nós temos muitas inserções parentéticas. Quando percebemos que tínhamos de ter falado alguma coisa antes para o outro entender o que estamos falando o que fazemos? Abrimos parênteses. Na visão funcionalista de interação verbal estamos o tempo todo tentando avaliar que informação temos em comum com o nosso destinatário, para poder apresentar essa informação como nova ou não, ou apenas retomar. Se eu parto do princípio de que ele não tem essa informação, o que eu vou fazer? Vou abrir um parêntese para representar essa informação, para ele poder entender o que eu estou dizendo. Outra estratégia é fazer a correção e a paráfrase, que são essenciais para o desenvolvimento do tópico. Não é como um texto escrito planejado no computador. Planejamos o texto a partir da unidade central. Errou, volta e apaga. Na fala, errou, disse uma coisa que não queria? Não tem como voltar atrás. Então temos a relação de correção. Outra coisa que estudamos também na língua falada são alguns marcadores discursivos, como o “mas”, o “então”, o “agora”. Por que marcador discursivo? Muitas vezes as palavras não funcionam naquela classe na qual elas deviam funcionar. Vamos pegar o exemplo do “mas”. Quem aqui nunca começou uma pergunta com o “mas”? Por exemplo, “Mas e fulano, não vai?”. Já começa um período com “mas”. Nem temos uma oração antes e já começamos respondendo para o outro com o “mas”. Não é uma oração adversativa. Esse “mas” não está sendo usado na função dele de conjunção. Ali ele é um marcador discursivo. O “agora” por exemplo, é um advérbio de tempo: “Estou com sede agora”. Só que podemos usar como marcador discursivo. Um professor fala “olha eu gosto de ler, eu gosto de estudar, agora, escrever eu faço por obrigação e pressionado”. Esse “agora” está sendo analisado em uma relação de contraste. Ele não é mais um advérbio de tempo. Na língua falada usamos muito as palavras em uma outra função que não é a da classe à qual ela pertence.

OC: A RST, com o uso que faz de ferramentas tecnológicas, pode ser a prova de que caminhamos para um contexto literal de análise automática de textos, com uso exclusivo da inteligência artificial?

Antonio: Falamos que são aplicações automáticas para tarefas linguísticas complexas, porque tarefas linguísticas simples, como, por exemplo, a parte gramatical de concordância, ortografia, já se faz há muito tempo. Desde os anos 1990 já temos os corretores. A parte gramatical é tranquila, mas tem tarefas linguísticas complexas, que os computadores estão começando a dominar agora. E não só a RST que faz isso. Há muitas teorias linguísticas que são utilizadas para desenvolver essas tarefas linguísticas complexas. A primeira coisa que eu gostaria de destacar é que esses diagramas que fazemos não são feitos automaticamente, não é o programa, não é a interface que faz o diagrama sozinho, é o analista quem faz a análise. Ele usa essa interface para poder facilitar a criação do diagrama, para ele não ter que ficar desenhando na mão. Temos duas ferramentas na RST que utilizamos, uma é o RSTTool. Temos o texto todo na aba text, segmentamos o texto, colocamos um sinalzinho lá na frente dos segmentos, e o programa vai apresentar o texto assim com os tópicos já segmentados. As relações são detectadas, ligam-se os segmentos, seleciona-se a relação, e o programa vai criando o diagrama. Mas quem faz a análise é o analista. Recentemente saiu uma ferramenta, que é o rstWeb, que pode ser utilizada no próprio navegador, o Chrome mesmo. Utilizar essa interface para fazer os diagramas dá um acabamento muito melhor. Esse é mais recente. A outra estava bem antiga, era de 2000. Mas o importante é não ficarem achando que o computador faz análise sozinho. Nós fazemos, e a interface é uma mediadora para facilitar a criação do diagrama. E quais são essas tarefas linguísticas complexas que o computador pode fazer? Pode fazer segmentação automática de texto. Existem segmentadores automáticos para várias línguas. Faz a segmentação daquelas unidades discursivas elementares das quais eu falei lá trás. Vai segmentar em oração coordenada, oração adverbial, mas não vai segmentar a oração substantiva, nem restritiva. Ele reconhece as estruturas gramaticais e segmentos dos textos automaticamente. No ano passado, a American Airlines colocou em vários aeroportos dos Estados Unidos totens com tradutores automáticos. A pessoa fala na língua dela, e o totem traduz para o atendente em inglês. O atendente fala em inglês, e esse totem passa para a língua daquela pessoa, para facilitar o check-in de quem não fala inglês. Portanto, não é só tradução automática de texto, mas tradução automática de fala também. Avaliação automática de textos escritos é possível também. Recuperação de informação, também, é possível. Podemos mandar o computador buscar algumas informações específicas em determinado texto. Essas são algumas tarefas linguísticas complexas que podem ser feitas por computador. A RST pode ter participação em algumas delas. Vou dar um exemplo. Uma colega de Barcelona, Iria da Cunha, que dá aula na UNED, a Universidade Nacional de Ensino a Distância, trabalha com RST e desenvolveu um sistema automático, o artext, que ajuda a escrever textos especializados em espanhol de três diferentes áreas: Medicina, Administração Pública e Turismo. O projeto é desenvolvido em uma pesquisa interdisciplinar que reúne dois campos: a linguística, com a análise de um texto especializado, e o PLN (processamento de línguas naturais), para processamento de linguagem natural, que chamamos de linguística computacional. Na Administração Pública pode-se estruturar uma alegación, uma queja e solicitud.  No campo da Medicina, pode-se estruturar um artigo de investigação, artigo de revisão, histórico clínico, resumo de artigo de investigação. O programa vai estruturar um abstract e pode até estruturar um TCC, o trabalho de conclusão de curso. No Turismo, pode-se estruturar um artigo de investigação, entrada em blog de viajante, informe, normativa e um plano de negócios. Como que a colega da UNED fez isso aqui? Estudou a fundo cada um desses campos e cada um desses gêneros. Ela tem um levantamento das marcas linguísticas de cada um desses tipos de textos. Vamos supor que alguém quer fazer uma carta de apresentação. A pessoa clica e vai ter as partes do texto. O produtor do texto vai digitar o conteúdo apenas. Quando terminar de digitar o conteúdo de cada uma das partes do texto, o sistema artext vai dar o acabamento final, ligando as partes do texto, relacionando essas partes e colocando no formato que se espera que aquele gênero tenha. É basicamente isso que ele faz, ele abre um processador de texto para digitar cada parte do texto. Depois as partes vão ser ligadas, relacionadas com marcadores discursivos. Enfim, vai ter correções e sugestões. Um outro trabalho relevante é o de Mikel Iruskieta, da Universidade do País Basco. Ele e sua equipe criaram um detector automático de unidade central do português do Brasil, a partir daquele vestibular “Qual o segredo do vestibular: a inteligência e esforço, ou sorte?” Lembrem-se daquelas regras que eu apresentei do padrão de resposta para esse vestibular? A resposta está no começo do texto. Pode ter um verbo evidencial, pode ter uma palavra como mistura, junção, enfim, com base naquilo, o Mikel, que é linguista e trabalha com computação também, descobre quais são as características e as apresenta para o computador, que vai tentar, com base nessas características, identificar a unidade central. A única coisa que o analista vai fazer é colocar o texto segmentado, oração por oração. Assim, quem for professor e tiver aluno que está se preparando para o vestibular, e for utilizar esse tema [Qual o segredo do vestibular…?] para a preparação dos seus alunos, vai poder colocar o texto dos alunos e o sistema vai indicar a unidade central. A inteligência artificial é tentar fazer a máquina reproduzir os processos cognitivos que os humanos usam. Ela é utilizada na educação também, sugerindo métodos de abordagem para determinados alunos com dificuldade. Tentando responder ainda à pergunta, recordo-me que em 2013 teve uma mesa-redonda no Simpósio Internacional de Linguística Funcional, formada por um linguista, no caso eu, uma professora da USP da linguística computacional e um professor de São Carlos, Osvaldo Oliveira Junior, da Física, e que trabalha com tecnologia. Na ocasião, esse professor falou o seguinte: “Olha, a cada ano que passa, os computadores e celulares conseguem processar cada vez mais informações com processadores cada vez menores, e a tecnologia vai barateando”. E ainda deu exemplos: “Daqui alguns anos você não vai precisar telefonar para o médico, para o salão de cabeleireiro, para marcar uma consulta e um horário. O teu dispositivo móvel vai fazer isso por você. Ele vai entrar em contato com o dispositivo móvel, o sistema lá do salão de cabeleireiro, do médico, do dentista, e vai marcar para você”. No final do ano passado, em uma feira de tecnologia, o Google apresentou uma agenda entrando em contato automaticamente com a agenda do médico para marcar um horário. Essas coisas tendem a ser mais comuns conforme os computadores forem evoluindo, e a cada ano que passa essa tecnologia evolui mais rápido. Não vou dizer que não vai acontecer, mas também não vou dizer que vai acontecer com certeza, das máquinas substituírem totalmente os homens. Vinte anos atrás imaginaríamos pegar um celular e chamar um carro que iria levar a gente onde quisesse? Então está em aberto. As pessoas têm que aprender línguas e matemática. Isso é muito importante para o futuro, porque as máquinas tendem a retirar o lugar e o trabalho das pessoas. Infelizmente temos umas previsões bem negativas para o futuro, porque as máquinas estarão ocupando muito mais lugares que hoje.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *