Fulltext available Open Access
License: 
Title: Generalized Additive Models for very large datasets with Apache Spark
Language: English
Authors: Brusch, Kai Thomas 
Issue Date: 9-Jan-2017
Abstract: 
The generalized additive model extends of the generalized linear model with the ability to describe predictor variables as the sum of unknown smoothing functions. The generalized additive model has been used in domains that require very large datasets. Although the generalized additive model is helpful in those scenarios, no public attempt has been made to implement it in a modern cluster computing environment. Apache Spark, a modern cluster computer framework, has provided an implementation for the generalized linear model to be estimated on very large datasets. The unknown smoothing functions can be expressed as B-Splines and estimated as part of a generalized linear model. This thesis implements the generalized additive models as an extension of the generalized linear model in Apache Spark by representing the unknown smooth functions as B-Splines in the Cox-de-Boor form.

Das GeneralisierteAdditive Modell erweitert das Generalisierte Lineare Modell mit der Fähigkeit, eine oder mehrere unabhängige Variablen as Unbekannte glätende Funktionen darzustellen. Das Generalisierte Additive Model erfreut sich Beliebtheit in Feldern, die sehr grosse Datenmengen erfordern. Obwohl dies der Fall ist, wurde das Generalisierte Additive Modell noch in keinem modernen Cluster Computing Framework implementiert. Apache Spark ist ein modernes Cluster Computing Framework, welches eine Implementation des Generalisierten Linearen Modell beinhaltet. Diese Arbeit nutzt die, in Spark verfügbare, Funktionalität, um eine Teilmenge des Generalisierten Additive Modell in ein modernes Cluster Computing Framework zu implementierten. Ein Generalisiertes Additive Model kann als Generalisiertes Lineare Modell mit B-Splines realisiert werden. Dieses implementiert ein Generalisiertes Additive Modell als Generalisierte Lineare Modell mit B-Splines in der Cox-de-Boor Form als Erweiterung in Spark.
URI: http://hdl.handle.net/20.500.12738/7778
Institute: Department Informatik 
Type: Thesis
Thesis type: Bachelor Thesis
Advisor: Köhler-Bußmeier, Michael  
Referee: Schmaus, Markus 
Appears in Collections:Theses

Files in This Item:
File Description SizeFormat
BachelorarbeitKaiBrusch.pdf1.14 MBAdobe PDFView/Open
Show full item record

Page view(s)

197
checked on Apr 23, 2024

Download(s)

1,092
checked on Apr 23, 2024

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.