----------------------- REVIEW 1 --------------------- PAPER: 14 TITLE: Privamov : Suivi d'utilisateurs mobiles et reconstruction de trajectoires AUTHORS: Patrice Raveneau, Andrea Caballero, Razvan Stanica and Hervé Rivano OVERALL EVALUATION: 1 (weak accept) REVIEWER'S CONFIDENCE: 5 (expert) ----------- REVIEW ----------- Les figures 1 & 2 devraient être représentées avec des boites à moustache (boxplot). C'est la représentation consacrée pour ce type de données. Par ailleurs, les boites à moustache peuvent aussi représente les valeurs maximales et minimales, souvent importantes en statistiques, mais non représentées ici. Les auteurs notent que l'erreur est souvent faible, mais avec des valeurs extrêmes peu fréquentes : ce résultat était sans doute prévisible. Une personne reste souvent au même endroit pendant des laps de temps importants (erreur faible même avec échantillonnage grossier) mais se déplace par exemple pour rentrer chez lui (erreur importante). Ce qui me pose problème : l'échantillonnage fournit une erreur très importante quand l'utilisateur se déplace, et donc lorsqu'il est le plus susceptible d'utiliser un service localisé. Se focaliser sur les cas à erreurs faibles (i.e. sans mobilité) me semble limité. J'aurais au contraire préféré que les auteurs s'intéressent aux autres cas. Par ailleurs, un échantillonnage adaptatif semble le plus adapté. Ainsi, j'aurais trouvé plus pertinent de vérifier qu'un déplacement peut être détecté afin d'augmenter la fréquence d'échantillonnage. Enfin, les auteurs ne montrent pas la consommation d'énergie. En particulier, diviser par 2 le nombre de mesures GPS permet-il de diviser également par 2 la consommation d'énergie ? Il doit surement exister une valeur seuil à partir de laquelle la durée de recalibrage de la puce GPS consomme beaucoup, et donc ne permet pas d'économie substantielle. Quelles sont les précisions de localisation GPS recherchées ? Les auteurs peuvent-ils citer une référence pointant la précision nécessaire pour différents services ? commentaires mineurs: */ J'avoue ne pas comprendre comment un système de localisation basé sur des empreintes pourrait améliorer la vie privée. Exactement comme avec un GPS, le problème de vie privée se fait une fois la localisation réalisée. La méthode de localisation n'a pas d'impact, si ? */ card() doit représenter sans doute la cardinalité de l'ensemble. Pourquoi ne pas utiliser |X|, le plus souvent utilisé ? ----------------------- REVIEW 2 --------------------- PAPER: 14 TITLE: Privamov : Suivi d'utilisateurs mobiles et reconstruction de trajectoires AUTHORS: Patrice Raveneau, Andrea Caballero, Razvan Stanica and Hervé Rivano OVERALL EVALUATION: 2 (accept) REVIEWER'S CONFIDENCE: 4 (high) ----------- REVIEW ----------- Cet article s'intéresse à une problématique liée à la mobilité urbaine. Dans ce contexte, beaucoup d'application ont besoin de connaître la position des utilisateurs. Les auteurs étudient la pertinence de diminuer la fréquence d'échantillonnage d'information de localisation, afin de diminuer la consommation d'énergie des puce GPS, en compenser le baisse d'information par une reconstruction des positions manquante à l'aide de technique d'interpolation. La contribution des auteurs est double : les auteurs fournissent un jeu de données obtenu à partir d'une plateforme de collecte de traces de mobilités urbaines. Ils fournissent ensuite une estimation de l'erreur que donne leur méthode en comparant le jeu de données complet à plusieurs fréquences de sous-échantillonage et 2 techniques d'interpolation. Les résultats sont très intéressants et valident bien à mon sens l'approche proposée. Le papier est très clair et bien rédigé. Quelques questions cependant : - l'expérience montre que l'interpolation linéaire est plus précise que l'interpolation à base de polynôme d'ordre 3. Ce résultat est contre-intuitif mais aucune explication n'est fournie. Comment l'expliquer ? - les auteurs mentionnent plusieurs traces utilisées mais ce n'est pas très clair. Si c'est le cas, à quoi correspondent les courbes présentées ? À une trace caractéristique ? À l'ensemble des traces ? Est-ce qu'il n'y a pas des différences d'efficacité de la technique en fonction des jeux de données ? - les résultats d'erreurs sont fournis en valeurs absolues. Mais on n'a pas d'information sur les valeurs typiques des jeux de données. Il y aurait sûrement du sens à fournir des valeurs relatives, par ex. erreur en fonction de la distance parcourue entre les deux points de l'échantillonnage. ----------------------- REVIEW 3 --------------------- PAPER: 14 TITLE: Privamov : Suivi d'utilisateurs mobiles et reconstruction de trajectoires AUTHORS: Patrice Raveneau, Andrea Caballero, Razvan Stanica and Hervé Rivano OVERALL EVALUATION: 0 (borderline paper) REVIEWER'S CONFIDENCE: 3 (medium) ----------- REVIEW ----------- Cet article propose une analyse préliminaire de trace de coordonnées GPS de téléphones mobiles, afin d'en étudier la réduction potentielle de consommation énergétique par extinction périodique de la puce GPS. Pour cela, les auteurs ont collecté des données de positionnement par le biais d'une application Android et ont échantillonné ces traces pour essayer de les reconstruire par interpolation ensuite. Les résultats, bien que surprenants, sont encore très préliminaires. A mon avis, il manque plusieurs aspects pour bien comprendre le modèle : - Dans l'introduction, les auteurs parlent de mécanismes collaboratifs pour aider à la reconstruction de trace. Puis, pour étayer leurs dires, ils annoncent faire de l'interpolation sur les données locales à un téléphone uniquement. J'voue ne pas avoir bien compris l'intérêt pour l'objectif final de leur recherche ; - Les traces ont été collecté sur 2-3 jours de conférences (à Middleware 2014). 35 heures de collectes répartis sur 25 utilisateurs semble un ratio assez faible finalement (1,5 jour par utilisateur). De plus, ces données sont somme toutes extrêmement corrélé, rendant l'analyse statistique largement faussée... - Le calcul de l'interpolation n'est pas clairement posé en fin de page 2. Sauf connaissance préalable, on ne peut pas comprendre la méthodologie de calcul suivi par les auteurs ; - Les auteurs semblent ravi d'une erreur moyenne inférieur à 160 m dans tous les cas (pour l'interpolation linéaire). Il me manque le référentiel original pour estimer cela. Faire une erreur de 160 sur un déplacement de 10 m n'est pas pareil que faire une erreur de 160 m sur un déplacement de 10 km... Les utilisateurs étaient-ils à pied (auquel cas, meme en marchant bien, ils auraient du mal à faire plus de 1,5 km par 15 minutes) ou en transport motorisé ? - La vitesse moyenne des déplacements manque dans la section 3.2. En effet, les auteurs disent avoir retiré les mouvement de "mobilité nulle à faible" : quelle est la borne entre faible et non-faible ? Seulement en connaissant celle-ci nous serions en capacité d'estimer si une erreur de 100 m est correcte. - La phrase de conclusion annonçant des gains significatif de consommation d'énergie est intéressante. Mais j'aimerai pouvoir comparer la consommation induite par la puce GPS et celle induite par le calcul de l'interpolation en temps réel. La seconde est peut-être négligeable sur la première, rendant l'approche intéressante. Mais sans "preuve", il est difficile de croire sur parole... ----------------------- REVIEW 4 --------------------- PAPER: 14 TITLE: Privamov : Suivi d'utilisateurs mobiles et reconstruction de trajectoires AUTHORS: Patrice Raveneau, Andrea Caballero, Razvan Stanica and Hervé Rivano OVERALL EVALUATION: 1 (weak accept) REVIEWER'S CONFIDENCE: 4 (high) ----------- REVIEW ----------- Ce papier étudie s'il est possible de reconstruire une trajectoire réaliste avec un nombre de positions limité. Pour cela, des traces ont été réalisées, puis ensuite sous-échantillonnées, pour finalement étudier l'efficacité de méthodes d'interpolation des positions des utilisateurs et évaluer l'erreur introduite par rapport à la réalité (qui est connue). Il est conclu qu'il est possible de largement sous-échantillonner la récupération de position tout en conservant une erreur tolérable dans 80 à 90% des cas. Le sujet d'étude est assez simple et certaines conclusions assez évidentes, notamment le fait de supprimer les périodes stables qui biaisent complètement l'évaluation lorsqu'elles durent longtemps. A propos des valeurs anormalement élevées faussant la moyenne, la médiane confirme cette idée, et elle est présente sur les graphes ! Pourquoi avoir retiré l'interpolation cubique alors que les résultats étaient biaisés par la sédentarité ? Il me semble que les interpolations polynomiales sont plus sensible aux paramètres d'entrées, et que du coup les gros écarts remarqués lors de l'évaluation non filtrée peuvent être dus à ce biais. Une remarque sur l'évaluation : pourquoi ne pas avoir mené l'étude sur d'autres données issues d'ensembles disponibles publiquement ? L'effort est assez réduit et cela aurait permis de valider la méthodologie. Également, quel est l'impact de la vitesse de déplacement ? Piéton, vélo, voiture, l'approximation doit être meilleure pour les déplacements plus lents. Enfin, je me pose quelques questions sur certaines motivations, notamment pour la collecte, celle de la limitation en mémoire des téléphones qui empêcherait de conserver les données suffisamment longtemps : les téléphones ont aujourd'hui des mémoires gigantesques, la moindre photo faisant des Mo, ces données sont nettement plus compactes. Des plus, le positionnement ne se fait plus uniquement au moyen du GPS, et le GPS aussi devenu plus économe en énergie, est-ce toujours aussi justifié ? Des références chiffrées auraient permis de convaincre le lecteur. De même "Une précision de l’ordre de la centaine de mètres est plus qu’acceptable pour la majorité des applications ayant besoin de l’information de localisation", référence, exemple ? Remarques générale : - la figure 3 passe très mal