Automatic document indexing using terms extracted from highlights

Authors

DOI:

https://doi.org/10.28998/cirev.2024v11e16800

Keywords:

indexing, automation, text highlights

Abstract

The process of indexing and retrieving information plays a crucial role in the efficient organization of documents and quick access to relevant content. The research addresses automation in the document indexing process, also discussing aspects related to extracting terms from highlights. The working methodology takes a qualitative approach, fitting into the category of literature review characterized as narrative, as it was conducted inductively through a bibliographic search for terms related to the themes of the work in indexing databases. The results emphasize the importance of continuous research and the development of effective algorithms for the automatic indexing of documents based on terms extracted from highlights. This approach has the potential to enhance the efficiency of information organization and make document access more accurate and agile in various fields, including Library Science, Information Science, and document management systems.

Downloads

Author Biographies

Nathaly Leite, Universidade de Brasília

Mestra e Graduada em Ciência da Informação pela Universidade de Brasília. Pesquisadora Assistente na Coordenação de Tecnologia Aplicada a Novos Produtos do Instituto Brasileiro de Informação em Ciência e Tecnologia.

Dalton Lopes Martins, Universidade de Brasília

Doutor em Ciência da Informação pela Universidade de São Paulo, Mestre em Engenharia da Computação e Graduado em Engenharia Elétrica pela Universidade Estadual de Campinas. Professor do curso de Biblioteconomia e do Programa de Pós-graduação em Ciência da informação da Faculdade de Ciência da Informação da Universidade de Brasília. Coordenador Geral do Instituto Brasileiro de Museus.

References

AGUIAR, F.; KOBASHI, N. Organização e representação do conhecimento: perspectivas de interlocução interdisciplinar entre Ciência da Informação e Arquivologia. In ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 16.,2013, Florianópolis. Anais [...] Florianópolis: PPGCI, 2013

BERNARDO, J. C. O.; KARWOSKI, A. M. A leitura em dispositivos digitais móveis. ETD - Educação Temática Digital, [S. l.], v. 19, n. 4, p. 795–807, 2017. Disponível em: https://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8646355.

BRASCHER, Marisa; CAFÉ, Ligia. Organização da informação ou organização do conhecimento? In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 9., 2008, São Paulo. Anais [...] São Paulo: PPGCI, 2008. p. 1-14

BRÄSCHER, M.; MONTEIRO, F. S. Organização da informação em repositórios digitais. Encontros Bibli: Revista Eletrônica de Biblioteconomia e Ciência da Informação, v. 15, n. 29, 2010.

BRAVO, B. R. El documento: entre la tradición y la renovación. Ediciones Trea, 2002

BRITO SILVA, S.R. Sistemas de indexação automática por atribuição: uma análise comparativa. Dissertação (Mestrado em Ciência da Informação – Departamento de Ciência da Informação, Universidade Federal de Pernambuco. Recife. 2020.

BUCKLAND, M. K. What is a document? Journal of the American Society for Information Science, Washington, v.48, n.9, p. 804-809, Sept., 1997.

CAFÉ, Lígia; SALES, R. Organização da informação: conceitos básicos e breve fundamentação teórica. In: Jaime Robredo; Marisa Bräscher (Orgs.). Passeios no Bosque da Informação: Estudos sobre Representação e Organização da Informação e do Conhecimento. Brasília DF: IBICT, 2010. 335 p. ISBN: 978-85-7013-072-3. Capítulo 6, p. 115-129. Edição eletrônica.

COOK, L.K.; MAYER, R.E. Reading Strategies Training for Meaningful Learning from Prose. In: PRESSLEY, M.; LEVIN, J. R. (Ed.) Cognitive Strategy Research. New York? Springer, 1983. p. 87-131. http://dx.doi.org/10.1007/978-1-4612-5519-2_4

DANTAS, T., MANGAS-VEGA, A., GOMÉZ-DÍAZ, R., CORDÓN-GARCÍA, J. A. Pesquisa em leitura e pesquisa em leitura digital: panorama do atual cenário científico. Informação & Sociedade: estudos., João Pessoa, v.27, n.2, p. 117-131, maio/ago. 2017.

DI VESTA, F. J.; GRAY, G. S. Listening and note taking. Journal of Educational Psychology, v. 63, n. 1, p. 8–14, 1972.

FAVERIO, M.; PERRIN, A. Three-in-ten Americans now read e-books. Pew Research Center, 6 jan. 2022. Disponível em: https://www.pewresearch.org/fact-tank/2022/01/06/three-in-ten-americans-now-read-e-bo oks/. Acesso em: 25 fev. 2024.

FIDEL, R. User-oriented indexing. Journal of the American Society for Information Science, v. 45, p. 572-576. 1994.

GIL-LEIVA, I. Manual de indización: teoría y práctica. Gijón: Trea, 2009.

GLUSHKO, Robert J. The Discipline of Organizing: Professional Edition. 4. ed. O'Reilly Media, 2016.

PASCUAL, C. H. El contenido de los documentos textuales: su análisis y representación mediante el lenguaje natural. In: MOREIRO GONZÁLEZ, José Antonio. Anales de Documentación. 2005. p. 285-98. Disponível em: https://revistas.um.es/analesdoc/article/view/3501. Acesso em: 25 fev. 2024.

GOUVEIA, L. M. B; GAIO, S. Sociedade da informação: balanço e oportunidades. Rio de Janeiro: Universidade Fernando Pessoa, 2004.

GUINCHAT, C.; MENOU, M. Introdução geral às ciências e técnicas da informação e documentação. 2.ed. rev. aum. Brasília: Ibict; CNPq, 1994. 540 p.

KELLY, Kevin. O que os Livros se tornarão. In: SILVEIRA, Julio (Org.). Livrolivre, Novas Possibilidades do Digital para a Escrita, a Leitura e a Publicação. Rio de Janeiro: Imã Editorial, 2011. p.17-37.

LANCASTER, F.W. Indexação e Resumos: teoria e prática. 2. ed. Brasília, DF: Briquet de Lemos, 2004

LAPA, R. C.; CORRÊA, R. F. Indexação automática no âmbito da Ciência da Informação no Brasil. Informação & Tecnologia, v. 1, n. 2, p. 59-76, 2014. Disponível em: http://hdl.handle.net/20.500.11959/brapci/41624. Acesso em: 25 fev. 2024.

LE COADIC, Y.F. A Ciência da Informação. 2. ed. Brasília, DF: Briquet de Lemos, 2004

LEUTNER, D.; LEOPOLD, C.; DEN ELZEN-RUMP, V. Self-regulated learning with a text-highlighting strategy: A training experiment. Zeitschrift für Psychologie/Journal of Psychology, v. 215, n. 3, p. 174–182, 2007.

LÓPEZ YEPES, J. Hombre y documento: del homo sapiens al homo documentador. Scire, Zaragoza, v.4, n.2., jul-dec., 1998.

MICHEL, J. L’Information et documentation un domaine d’activité professionnelle en mutation: LCN Les Métiers du Numérique. Hermès, v. 1, n.3, p. 47-64, 2000.

NARUKAWA, C. M.; GIL LEIVA, I.; FUJITA, M. S. L. Indexação Automatizada de Artigos de Periódicos Científicos: análise da aplicação do software SISA com uso da terminologia DeCS na área de Odontologia. Informação & Sociedade: estudos, João Pessoa, v. 19, n.2, p. 99-118, 2009.

OTLET, P. Traité de documentation: le livre sur le livre: théorie et pratique. Bruxelles: Mundaneum, 1934.

PINTO, V. B. Indexação documentária: uma forma de representação do conhecimento registrado. Perspectivas em Ciência da Informação, Belo Horizonte, v.6, n.2, p.223-234, jul./dez., 2001.

ROBREDO, J. Documentação de hoje e de amanhã. 4. ed. rev. ampl. Brasília, DF: Ed. Do Autor, 2005.

SAMPIERI, R. H.; COLLADO, C. F..; LUCIO, M. P. B. Metodologia de pesquisa. 5. ed. Porto Alegre: Penso, 2013.

SANTOS, H. M. D.; FLORES, D. O documento digital no contexto das funções arquivísticas. Páginas A&B, Arquivos e Bibliotecas (Portugal), n. 5, p. 165-177, 2016. Disponível em: http://hdl.handle.net/20.500.11959/brapci/65458.

SHERA, J. H.; EGAN, M. E. Examen del estado actual de la biblioteconomía y de la documentación. Santa Fe, Argentina: Centro de Documentación e Información de Asuntos Municipales Doctor Alcides Greca, 1953.

SILVA, I. C. O.; GOUVEIA, F. C. A busca e o acesso às informações sobre saúde no contexto tecnológico. Revista Conhecimento em Ação, Rio de Janeiro, v. 4, n. 2, p. 23-45, 2019. Disponível em: http://hdl.handle.net/20.500.11959/brapci/127448. Acesso em: 25 fev. 2024.

SILVA, M. Sala de aula interativa. 4. ed. Rio de Janeiro: Quartet, 2006

SIQUEIRA, J. C. A noção de documento digital: uma abordagem terminológica. Em Questão, Porto Alegre, v. 18, n. 1, p. 125–140, 2012. Disponível em: https://seer.ufrgs.br/index.php/EmQuestao/article/view/24172. Acesso em: 25 fev. 2024.

WEINSTEIN, C; MAYER, R. The Teaching of Learning Strategies. In: WITTROCK, M. (Ed.) Handbook of Research on Teaching, Macmillan, New York. p. 315-327, 1986.

ZAYAS, E. L. et al. O paradigma da educação continuada. Porto Alegre: Penso, 2012.

Published

2024-12-25

How to Cite

Leite, N., & Lopes Martins, D. (2024). Automatic document indexing using terms extracted from highlights. Ciência Da Informação Em Revista, 11, e16800. https://doi.org/10.28998/cirev.2024v11e16800

Issue

Section

Artigos | Articles

Similar Articles

1 2 3 > >> 

You may also start an advanced similarity search for this article.