Bordeaux 3 - Statistiques TEL
Bordeaux 3 - Statistiques de téléchargement des thèses électroniques + portail des thèses[modifier le wikicode]
- Auteur : Sylvain Machefert
- Date : novembre 2013
Contexte[modifier | modifier le wikicode]
Depuis le 1er janvier 2012, l'université Bordeaux 3 est passé au dépôt électronique des thèses. Le choix de la plateforme de diffusion s'est porté sur TEL[1].
Besoin[modifier | modifier le wikicode]
Suite à la mise en place de la thèse électronique, deux besoins sont apparus :
- présenter de manière simple les thèses soutenues et en cours à Bordeaux 3
- obtenir des statistiques sur la consultation de ces thèses
Présentation des thèses[modifier | modifier le wikicode]
Le premier point peut-être résolu par l'utilisation des web services mis en place par le site theses.fr. En ajoutant &format=xml
à une url de theses.fr on obtient les résultats au format XML. Le fichier index.php
intègre les différentes fonctions permettant d'afficher la liste des thèses. Ce script pourrait être amélioré par l'amélioration de la gestion des facettes.
Statistiques sur les thèses TEL[modifier | modifier le wikicode]
Récupération des thèses TEL[modifier | modifier le wikicode]
La récupération des thèses diffusées par TEL se fait par l'intermédiaire du serveur OAI du CCSD, à l'aide du script get_theses.php
en moissonnant le set qui correspond au tampon de la bibliothèque.
Récupération des statistiques de téléchargement[modifier | modifier le wikicode]
L'administrateur d'une collection HAL a la possibilité d'accéder aux statistiques de consultations des documents attachés aux collections dont il a la charge.
Pour ce second point, la première piste suivie a été d'utiliser la fonction getArticleCounter des web services HAL. Malheureusement on ne peut consulter les statistiques que pour les articles que l'on a déposé soi-même.
La solution finalement retenue a été de développer une solution de screen scraping à partir du compte administrateur de la collection (en effet, s'il n'est pas possible d'accéder aux statistiques de sa collection via le web service, il est possible de le faire par l'interface publique). Une méthode a donc été développée, basée sur la librairie php-curl[2] et qui fonctionne en deux temps :
- la fonction
stats_init_session
qui crée la connexion à l'interface d'admin et retourne lehalsid
qui correspond à l'identifiant de la session - la fonction
stats_get_from_tel
qui va prendre en paramètre l'identifiant tel de la notice et son identifiant dans la base de données puis va aller interroger le formulaire http://tel.archives-ouvertes.fr/stat_2011/consultationArticles/graphiqueNbCons.php avec les bons paramètres.
Code source[modifier | modifier le wikicode]
Le code source développé par Bordeaux 3 est disponible sur github et peut être librement réutilisé.
Liens externes[modifier | modifier le wikicode]
- Exemple de mise en œuvre sur le site de Bordeaux 3.