DSpace
 
  Repositório Institucional da Universidade de Aveiro > Departamento de Línguas e Culturas > DLC - Teses de doutoramento >
 English for science and technology: a computer corpus-based analysis of English science and technology texts for application in higher education
Please use this identifier to cite or link to this item http://hdl.handle.net/10773/4627

title: English for science and technology: a computer corpus-based analysis of English science and technology texts for application in higher education
authors: Howcroft, Susan Jean
advisors: Barker, Anthony
keywords: Linguística - Teses de doutoramento
Língua inglesa
Corpus (Linguística)
Terminologias
issue date: 1999
publisher: Universidade de Aveiro
abstract: This thesis presents two analyses: first the analysis of computer corpora from undergraduate textbooks to isolate the (American) English language of science and technology they present; secondly an analysis of the English language competence of undergraduates starting their university studies in science and technology. These two analyses are contrasted in order to apply the results to the design of an English language syllabus for first year undergraduates. A frequency and range word list was produced using a large baseline corpus to contrast with the main corpora taken from physics and chemistry textbooks on the students’ bibliographies as a resource for syllabus design. Secondly, four corpora, two main and two sub-corpora produced from the physics and chemistry textbooks on the bibliographies of the undergraduates were analysed using Biber’s (1988) algorithms and functions for variation across speech and writing. The student intake was tested over five years and the results of those tests analysed. It was found that there was considerable variation in the students’ levels of language competence. However, there was a close correlation between the students’ competence and the number of years they had studied English in secondary school. Nevertheless there were students with extremely advanced competence and some with little or no competence in English amongst the undergraduates. Comprehension of scientific texts was generally found to correlate with more advanced competence and more years of study. The frequency and range word list showed the contexts which are appropriate for materials to be used with these students and demonstrated variation from many of the accepted views of the language of science and technology. The computer corpora analyses varied from Biber’s academic prose category. The sub-corpora demonstrated greatest variation which is believed to be as a result of specific cultural and/or literary material in the analogies used in the textbooks. The heavy load of cultural background knowledge which the reader would need in order to work with the textbooks adequately was also found in the exercises the students were supposed to use for practice on the topic presented in the chapter. This and the interpretation of visuals in the textbooks were considered to be two principle factors that needed to be emphasised in a syllabus for first year undergraduates. However, given the time constraints on language teaching for science and technology students, a methodology which would lead to greater student autonomy is suggested using computer corpus-based studies - data- viii driven learning and computer-supported distance communications and learning.

Esta tese apresenta duas análises: primeiro uma análise de corpora computadorizados, criados a partir de livros dos estudantes de licenciaturas, para isolar a linguagem Inglesa (Americana) das ciências e tecnologias que apresentam; segundo uma análise dos conhecimentos da língua Inglesa que estes alunos apresentam ao iniciar os seus estudos universitários em ciências e tecnologias. Estas duas análises são postas em contraste para se aplicar os resultados obtidos ao desenho de um programa de língua Inglesa para os alunos do primeiro ano. Foi criada uma lista com a abrangência e a frequência das palavras de um corpus de larga base, para ser contrastada com os principais corpora compilados dos livros de física e química constantes das bibliografias dos estudantes, como uma fonte para o desenho de programas. Seguidamente, quatro corpora, dois principais e dois subordinados, produzidos a partir dos livros de física e química referidos nas bibliografias dos estudantes, foram analisados usando os algoritmos e funções de Biber (1988) para variações entre linguagem falada e escrita. Durante cinco anos, à entrada para a Universidade, os estudantes foram submetidos a testes e os resultados analisados. Constatou-se que havia variações consideráveis no nível de conhecimentos da língua por parte dos estudantes. Contudo, havia uma correlação apertada entre as competências dos estudantes e o número de anos que tinham estudado Inglês nas escolas secundárias. Todavia, havia estudantes com competências extremamente avançadas e outros com competências reduzidas, ou quase nulas, em Inglês. A compreensão de textos científicos estava geralmente correlacionada com os níveis mais avançados de competências e maior número de anos de estudo. A lista com a abrangência e a frequência das palavras mostrou os contextos apropriados dos materiais a utilizar com estes estudantes e demonstrou que havia diferenças em relação a muitos dos pontos de vista aceites em relação à linguagem das ciências e tecnologias. A análise dos corpora computadorizados varia das categorias da linguagem da prosa académica de Biber. Os corpora subordinados mostram uma maior variação, que se julga ser devida a materiais específicos, culturais e/ou literário, usados nas analogias dos livros de estudo. O grande peso dos conhecimentos de fundo de que os estudantes necessitam para trabalhar adequadamente com os livros de estudo foi, também, encontrado nos exercícios que necessitam de fazer para praticarem o que está referido nos tópicos dos capítulos. Isto, juntamente com a interpretação das imagens dos livros, foram considerados os dois principais factores a precisarem de ser relevados no programa para o primeiro ano dos estudantes. Contudo, atendendo às restrições de tempo x para o ensino de línguas a estudante de ciências e tecnologias, a metodologia que conduziria a maior autonomia dos alunos será baseada na utilização de corpora computadorizados (data-driven learning) e aprendizagem à distância assistida por computador.
description: Doutoramento em Linguística
URI: http://hdl.handle.net/10773/4627
appears in collectionsUA - Teses de doutoramento
DLC - Teses de doutoramento

files in this item

file description sizeformat
131.pdf8.42 MBAdobe PDFview/open
statistics

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Valid XHTML 1.0! RCAAP OpenAIRE DeGóis
ria-repositorio@ua.pt - Copyright ©   Universidade de Aveiro - RIA Statistics - Powered by MIT's DSpace software, Version 1.6.2