Fragen zu Panchendrarajan et al. (2016) und Preoţiuc-Pietro et al. (2019)

Fragen zu Panchendrarajan et al. (2016)

  1. Seite 129, linke Spalte erster Absatz:""This behavior of different aspects can be modeledas hierarchical relationships so that the rating valueof an aspect can be calculated as a composite scoreof its sub-aspects.""Bedeutet das, dass die Bewertung eines (Haupt-)Aspekts, der mehrere Unteraspekte hat, NUR aus den Unteraspekten berechnet wird? Oder trägt er auch noch einen eigenen Grundwert in sich, der dann mit den Werten der Unteraspekte verrechnet wird?
  2. Seite 129, linke Spalte, dritter Absatz, Mitte:Ist es nicht auch ein Problem, dass Wörter wie small subjektiv sind? Für Person A ist eine Pizza mit 30 CM Durchmesser zu groß. Für Person B vielleicht genau richtig.
  3. Nach welchen Kriterien wurden die Unterkategorien ausgewählt und wie wurde deren Signifikanz sichergestellt werden? Wie wird mit Aspekten umgenagen, die nicht in der Hierarchy enthalten sind?
  4. Der Ansatz wirkt relativ zugeschnitten auf Restaurant-reviews, wie können die Erkenntnisse auch für andere Bereiche, bzw reviews aus anderen Branchen angewendet werden?
  5. Was ist die „maximum entropy classification technique” (S. 130), welche genutzt wird, um explizite Aspekte zu identifizieren?
  6. S. 128 - Frage zu Entities: Wenn ich eine Kundenrezession habe, die z.B. lautet ,,War lecker"" wäre hierbei ,,lecker"" die Entity?
  7. Warum gibt es bei einem review wie ""I would recommend this restaurant!"", das die overall experience als aspect hat, keine ""directly associated entity"", dem dieser aspect zugeordnet ist? Warum ist die overall experience keine entity? Ist das ein zu allgemeiner Begriff? Müssen sich entities immer auf konkrete DInge beziehen? Wenn ja, warum?
  8. In welcher Sprache befindet sich das data set und hat die Sprache/Kultur einfluss auf das Thema (Reviews)?
  9. Warum wird bei 'Rule 2' Food gegenüber Desert bevorzugt? (Panchendrarajan)
  10. Was bedeutet der F1-Wert im Abstract? (Panchendrarajan)
  11. Wie komplex ist das angewandte Hierarchiemodell – woran kann ich erkennen, ob ein solches Modell zu komplex für praktische Anwendung wird?

Fragen zu Preoţiuc-Pietro et al. (2019)

  1. p5011 f.Muss man all diese Modelle kennen?
  2. Generelle Frage:was genau bringen nochmal Unigrams? Die Wörter werden dann doch einzeln, ohne Kontext betrachtet? Ist das bei einer Complainment / Sentiment Analysis nicht überflüssig, da sich ja erst durch den Kontext zeigt, was die Worte bedeuten?
  3. Nach welchen Kriterien wurden die 93 customer support handles ausgewählt? (Oder allgemein, welche kriterien sind bei der Auswahl entscheidend?)
  4. Wie beeinflussen Distant Supervision und Domain Adaptation die Vorhersagegenauigkeit von Beschwerden, und welche Methode zeigt sich als effektiver bei der Integration von zusätzlichen Datenquellen?
  5. Warum wurden u. a. ""nur"" Tweets identifiziert/ausgewählt, bei denen der Customer Support geantwortet hat? (S. 5010) Was ist mit den Tweets (Complaints) an den Customer Service, die nicht beantwortet wurden? Warum wurden diese nicht in der Collection berücksichtigt?
  6. Bitte die ""Table 4"" auf der Seite 5013 in Bezug auf ""univariate Pearson correlation"" erklären!
  7. S. 5009 Was ist mit ,,favorable event"" und ,,unfavorable event"" gemeint? Gibt es für diese Events bestimmte Beispiele?
  8. S. 5010 Annotation: Worauf wurde bei der Annotation geachtet? Hauptsächlich nur ob es Complaints enthält?
  9. Wie kann zwischen Ironie und einer erstgemeinten Beschwerde unterschieden werden?
  10. Warum wird Twitter als Datenquelle für die Erstellung der Datensätze ausgewählt und nicht ""seriösere"" Plattformen?
  11. Was genau ist die Cohens Kappe Value?
  12. to annotate 1900 Tweets seems like a task that relates to a lot of Work, isnt there a way to minimize the workload like a aleready trained model? S.5010
  13. how would the study be on a different social media platform like Facebook or Instagramm?
  14. how can you annotate more automatically cause this is the most work in this studies in order to get more results?
  15. Was sind Unigrams und was ist der ""bag-of-words approach""?
  16. Werden die Daten auch nach Features annotiert? Oder findet der lernalgorithmus die feature-Wert selber?
  17. Warum sind data sets aus der Forschung nicht immer verfügbar?
  18. Wieviel Einfluss entsteht durch das annotieren und das auswerten der Ergebnisse, durch die selben Personen?
  19. Wenn nur Tweets benutzt werden, auf welche die Firma geantwortet hat, ist das eine 'selection bias', da ein Unternehmen nur auf halbwegs sachliche Beschwerden antwortet? (3.1)

Beide/Unklar

  1. Welche Werte in Table 6 (Preoțiuc-Pietro et al:5015) sind bei so einer Aufgabenstellung besonders wichtig / interessant? Warum werde alle Methoden genutzt/ angegeben bzw. warum in Panchendrarajan nicht? → Ist es sinnvoll, die beiden vorgestellten Modelle zu vergleichen zu versuchen? (vgl. in Panchendrarajan et al.:134ff)
  2. Was genau wurde getan, um der Subjektivität der Annotation entgegenzuwirken? Ist es möglich, ein objektives Kriterium/ Einschätzung durch die Summe vieler subjektiver Meinungen zu erreichen? Wie aussagekräftig kann die Studie sein?
  3. Was müsste man tun, um die Modelle zu kombinieren?
  4. Ist der Anteil der Forschung aus der freien Wirtschaft hoch? Sind „Wirtschaftskollaborationen“ häufig?
  5. Handelt es sich bei dem Gegenstand der jeweiligen wissenschaftlichen Arbeit um „ein Problem auf der Suche nach einer Lösung“ oder um „eine Lösung auf der Suche nach einem Problem“, wie der Engländer so schön sagt? Mit anderen Worten: ist es sinnvoll, subjektive und unstrukturierte Meinungsäußerungen auszuwerten? Wäre es nicht sinnvoller, für ein objektives Bild der Kundenzufriendenheit („customer satisfaction“) mit einem strukturierten Bewertungsformular nach expliziten Aspekten zu entwerfen bzw. im Vergleich zu Konkurrenzprodukten zu bewerten (wobei Preis/Leistung sicherlich eine Rolle spielen)? Bzw.: Kann es sich ein Unternehmen leisten, NICHT jede Service-Anfrage gewissenhaft individuell zu bearbeiten - wobei die Arbeit vielleicht weniger in der (automatisierten) Beantwortung der Fehlermeldung als in der eigentlichen Behebung des Fehlers liegt? (Einen möglichen Nutzen dieser Arbeiten wäre vielleicht eine automatisierte initiale Zustellung von Service-Anfragen bzw. Kundenzufriedenheitsäußerungen an die möglicherweise zuständige Abteilung/Person – aber auch das wäre wohl besser explizit vom Fragesteller bestimmt.)
  6. Welchen innovativen Ansatz bringen die Autoren der jeweiligen wissenschaftlichen Arbeit dem Problem bei? Kann ich diesen Ansatz nachvollziehen, ist er logisch und verständlich erklärt? Bringt dieser Ansatz einen nennenswerten Fortschritt zur effektiven Aufarbeitung des erklärten Problems? Ist der erzielte Erfolg (Precision/Recall/F1) in der Praxis ausreichend? Welche Ideen gibt es, mit möglichst geringem Aufwand weitere Verbesserungen zu erzielen?
  7. Liefern die Autoren in Ihrer wissenschaftlichen Arbeit genügend Informationen, um selber die beschriebene Problemlösung programmierungstechnisch umzusetzen? Legen die Autoren Ihre Testdaten und/oder den Programmcode offen, zum Herunterladen oder auf Anfrage, um selbst auszuprobieren, die vorgelegten Ergebnisse und angepriesen Erfolge nachzuvollziehen, bzw. ähnliche oder bessere Ergebnisse mit Hilfe alternativer Methodik zu erzielen? Sehe ich einen persönlichen Nutzen, solchen Aufwand zu betreiben, um intellektuellen oder kommerziellen Gewinn zu erzielen?