Saltar al contenido

Tecnología

Tecnología en General

Big Data

  • admin 

Quizás el aspecto más novedoso del nuevo paradigma se encuentra en el volumen de la materia prima de todo análisis: los datos. Aquí sí estamos presenciando en cierto modo una revolución, por el crecimiento de la magnitud de información que el ser humano es capaz de generar y almacenar. En 2010 se han generado unos 800exabytes de nueva información. Para poner dicha cifra en perspectiva, desde el inicio de los tiempos hasta 2005 el ser humano había almacenado unos 5 exabytes, cantidad que hoy se genera cada dos días. Y, en este aspecto, desde el más acérrimo fan de Hayek hasta el más recalcitrante comunista están de acuerdo en el valor de la información -los primeros argumentan que el sistema de precios es la institución espontánea más importante que ha creado el hombre, pues permite agregar información dispersa sin necesidad de una intención explícita; los segundos pretenden optimizar una función de utilidad individual para dar “a cada cual según su necesidad”-. ¿Dónde está entonces el problema con el Big Data?

Primer problema: nuestra capacidad de modelización es muy reducida

Una característica distintiva del Big Data es que se refiere generalmente a la posibilidad de modelizar y predecir ciertos comportamientos del ser humano. La nueva información que cada día se genera no se trata de nuevos datos de observaciones astronómicas o reacciones químicas, sino del rastro que deja en la red la acción humana, el cual puede ser fácilmente recolectado para su posterior análisis. Pero las novelas de Asimov y el cine de Hollywood se han encargado de transmitir una idea excesivamente optimista de nuestra capacidad real de modelización de fenómenos sociales o conductuales complejos. Una cosa es un experimento de laboratorio con 50 estudiantes de una misma universidad, del cual se puede extraer un patrón medio de comportamiento generando grupos de forma aleatoria, y otra muy distinta es que los investigadores puedan, a partir de información de la vida real, generar un modelo estructural de comportamiento que permita predecir la reacción de ciudadanos o clientes a determinadas medidas.

Allí donde una empresa o gobierno pueda generar experimentos, asignando clientes o ciudadanos aleatoriamente a distintos grupos, podrá tener una cierta certeza del efecto de una medida concreta. Por ejemplo, una cadena de supermercados puede experimentar con la respuesta del consumidor a cambios en los precios de algún producto seleccionando aleatoriamente la mitad de los supermercados de una ciudad y aplicando en ellos una rebaja. La selección aleatoria garantiza en este caso que el cambio de comportamiento se debe exclusivamente al efecto de la medida.

Pero este tipo de experimentos ya son fáciles de realizar desde hace décadas. Lo distintivo del Big Data es la recolección de datos de comportamiento real, y el problema aquí se encuentra en que las personas actúan por motivos muy complejos y en que ninguna “asignación a un grupo u otro” es aleatoria. ¿Está extraída de la misma muestra la gente que compra el pan en El Corte Inglés y quien lo compra en un supermercado Dia? Aquí es donde nuestra capacidad de modelización se topa con un muro de indescriptible complejidad, en el que un tratamiento ingenuo de la realidad puede llevar a conclusiones tremendamente erróneas.

Piensen en el clásico ejemplo de la mayor longevidad de los bebedores de vino sobre los de cerveza. La interpretación ingenua lleva a concluir que el vino aumenta la longevidad (o que la cerveza la acorta), pero bastan unos segundos para darse cuenta de que el comprador medio de vino es muy distinto del comprador de cerveza, y que su renta y hábitos de salud también difieren mucho. Si un ejemplo tan sencillo puede llevar a conclusiones erróneas, ¿qué no sucederá con fenómenos complejos en los que actúan simultáneamente varios factores? Imagine una enorme base de datos de impagos crediticios con información sobre renta, historial crediticio, localización, patrimonio, formación, sexo, etc. Arrojar todas las variables a un modelo múltiple para intentar predecir la probabilidad de un futuro impago devolverá medias condicionales, pero no habrá abordado la cuestión clave de todo análisis basado en datos no experimentales: la “endogeneidad”, esto es, el hecho de que la causalidad corre en varios sentidos y que las variables explicativas dependen unas de otras. Solo un modelo estructural explícito puede resolver este problema, pero ¿cuánta gente hay en el mundo capaz de plantearlo y contrastarlo? No pierdan tiempo buscando: realmente muy poca, y ellos mismos les dirán que aún tienen un amplio camino por recorrer.

En la medida en que los datos estén obtenidos de comportamientos reales, la complejidad del proceso será un muro difícil de franquear. Así, la capacidad de modelización a partir de bases de datos masivas, por prometedora que sea, es por ahora solo una quimera para el 99% del tejido productivo. Salvo algunas grandes compañías -solo Google o Facebook saben qué uso pueden estar haciendo con toda la información que recolectan-, el resto ha de conformarse con aprender gradualmente, aunque sí podrán beneficiarse de los incrementos de productividad que, por ejemplo, Google les pueda aportar.

Segundo problema: el Big Data solo es complementario con un tipo de capital humano muy específico

La intuición de este problema es sencilla: así como la revolución del motor de explosión fue posible por su complementariedad con cualquier tipo de trabajo –hasta el trabajador menos formado es mucho más productivo cavando una zanja con un martillo neumático-, los datos solo se complementan bien con una combinación de habilidades terriblemente escasa en la sociedad. Un “trabajador de los datos” necesita combinar tres tipos de conocimientos:

 1. Estadística pura y dura. Modelos lineales, generalizados, máxima verosimilitud, contraste de hipótesis, inferencia, machine learning… Casi todo el mundo puede aprender las matemáticas necesarias, pero lo cierto es que, a día de hoy, menos del 1% de la población tiene el conocimiento suficiente para comprender un modelo estadístico y sus implicaciones.

2.  Habilidades computacionales. Trabajar con datos masivos requiere en primer lugar la capacidad para manejarlos, e implementar modelos y algoritmos requiere soltura al menos en un lenguaje. Los paquetes estadísticos clásicos parecen estar perdiendo fuelle ante el empuje de herramientas open-source como R o Python, en las cuales la propia comunidad implementa en cuestión de días cualquier nueva funcionalidad. La buena noticia es que nunca fue tan fácil aprender a programar, gracias a la explosión de los cursos online (aquí una maravillosa introducción a Python, aquí una introducción a bases de datos y aquí otra para R).

3. Profundo conocimiento del tema a tratar. Este problema es, en esencia, el mismo al que con anterioridad nos referimos con el término “endogeneidad”, y es precisamente el mismo motivo por el que las suites de Business Intelligence han dado mucho menos de lo que prometían. Ningún modelo ni algoritmo puede garantizar predicciones fiables sin un conocimiento profundo del tema, es decir, sin un marco teórico sobre el que plantear el mismo. No existe una caja negra a la que podamos arrojar una tonelada de datos de la cual saldrá un patrón de comportamiento fiable. Además, las habilidades de modelización suelen adquirirse en el mundo académico, y allí donde el trasvase entre la academia y la empresa es fluido –siendo el ejemplo paradigmático el conglomerado Silicon Valley + Stanford + Caltech– los resultados son maravillosos. Pero allí donde la Universidad vive en un mundo paralelo y alejado de la excelencia, los resultados son nulos.

La conjunción de estas habilidades es hoy, y más en España, muy escasa (en nuestro caso habría que añadir las dificultades con el inglés). ¿Quién se beneficiará entonces de las nuevas posibilidades que traen los datos? ¿En qué medida esta nueva oportunidad puede dar a luz a un nuevo paradigma económico? Estas reflexiones nos llevan a las dos conclusiones que cierran este artículo.

Conclusión 1

Como anunciaba Hal Varian, el Big Data será muy provechoso para los trabajadores que reúnan las capacidades necesarias…, pero no necesariamente para el resto. Cuando una nueva materia prima (datos) solo es complementaria con un tipo escaso de habilidades, son los dueños de dichas habilidades los que se quedan la mayor parte del premio. Para que un país como España aprovechase las oportunidades de este nuevo mundo, habría de conseguir mejoras radicales y generalizadas en la formación en matemáticas, programación e inglés; de momento, España sigue en el vagón de cola de la educación en la OCDE.

Conclusión 2

Para que los avances del Big Data penetren de forma generalizada en la empresa, habrá de sortearse un problema fundamental: ¿quién será en cada empresa el encargado de decidir qué decisiones se pueden dejar a un modelo y cuáles no? Un modelo estadístico es algo muy opaco para el que no tiene la formación necesaria. En la anterior revolución, cualquier persona podía apreciar la facilidad con la que un martillo neumático perforaba el asfalto, cuantificar la ganancia de productividad y comprar la nueva maquinaria. El ejecutivo moderno, sin embargo, ha de decidir si confiar en los resultados de un modelo que probablemente no comprenda a la hora de tomar una decisión.

Fuente: http://www.sintetia.com/big-data-la-no-revolucion-requerira-sangre-sudor-y-lagrimas/

¿No sabes programar? 10 sitios donde aprender

Desde hace algún tiempo tenemos cada vez más presente el concepto de nativos digitales. Los niños, adolescentes y preadolescentes de ahora conforman esta nueva generación. Ellos han crecido con ordenadores, smartphones y tablets bajo el brazo, y la habilidad de los más pequeños para desenvolverse con estas tecnologías sorprendería a muchos.

Sin embargo, no todo el mundo está de acuerdo con que convivir con la tecnología desde pequeños sea una ventaja. Hay quien piensa, por ejemplo, que Google ha creado una generación de niños descerebrados, mermando su creatividad y la habilidad para valerse con sus propios recursos.

También Mitch Resnick, conocido investigador del MIT MediaLab, se muestra escéptico ante esta generación de nativos digitales, o al menos a ciertos aspectos relacionados con ellos: si bien los pequeños son capaces de chatear, navegar por Internet y jugar online desde edades muy tempranas, Resnick no tiene claro que tengan la misma capacidad en otro tipo de actividades tecnológicas más complejas.

Según Resnick, el problema de los nativos digitales no es la interacción con las nuevas tecnologías, sino su capacidad para crearlas. “Lo primero es como la lectura, mientras que lo segundo es como la escritura”. Por lo tanto, la creación de nuevas tecnologías, al igual que escribir un libro, requiere tanto una parte creativa como otra más técnica, que en este caso sería la capacidad de diseñar programas informáticos y escribir código.

No se trata de crear una generación de programadores, señala Resnick. Más bien, se trata de considerar la programación como una puerta a un mayor aprendizaje. «Cuando aprendemos a leer, podemos leer para aprender. Pasa lo mismo con la programación: si aprendes a escribir código, puedes codificar para aprender». Aprender a programar significa aprender a pensar creativamente, razonar sistemáticamente y trabajar en equipo. Y estas habilidades son aplicables a cualquier profesión, además de ser muy necesarias en nuestra vida personal.

Programacion

Resnick y su equipo del MIT han desarrollado Scratch, un programa que permite crear y compartir fácilmente animaciones y juegos interactivos. Además de este, Ted Blog nos recomienda 10 sitios web en los que cualquiera puede aprender a programar de manera fácil:

1. Codecademy ofrece clases para la escritura de comandos simples en JavaScript, HTML y CSS, Python y Ruby.

2. Girl Develop It es una organización internacional no lucrativa con el objetivo de que mujeres de cualquier edad, raza o nivel educativo puedan aprender a desarrollar aplicaciones web y móviles. De esta manera, ayudan a mejorar su carrera profesional y su confianza en la vida diaria.

3. Udacity, de la Universidad de Standford, es uno de los muchos sitios que llevan a cabo cursos universitarios online y gratuitos de introducción a la informática.

4. Code Racer ofrece un método más rápido para aprender a construir un sitio web utilizando HTML y CSS.

5. Computer ClubHouse es otro servicio cofundado por Resnick, cuyo objetivo es ayudar a los jóvenes de comunidades con escasos ingresos a aprender a expresarse de forma creativa con las nuevas tecnologías.

6. CoderDojo ofrece sesiones para que los más jóvenes puedan aprender a programar, viajar a empresas de tecnología o asistir a las charlas y conferencias de importantes figuras del sector.

7. Code School ofrece cursos en lína en una gran variedad de lenguajes de programación.

8. De igual manera, Treehouse también ofrece cursos online en vídeo y ejercicios para practicar lo aprendido.

9. Girls Who Code está orientado a chicas entre 13 y 17 años que sueñan con dedicarse profesionalmente algún día a la ingeniería y la tecnología. Como dato curioso afirman que sólo el 3,6% de las grandes compañías de tecnología están dirigidas por mujeres. Sin embargo, las mujeres utilizan Internet un 17% más que los hombres.

10. Por último y siguiendo con los sitios webs para mujeres, encontramos Black Girls Code, que ofrece talleres destinados a chicas jóvenes de raza negra, con el objetivo de solucionar el problema de la escasez de mujeres afro-americanas en las profesiones relacionadas con la ciencia, la tecnología, la ingeniería y las matemáticas.

Securing Backup Folder WordPress

When you use wp-dbmanager (wordpress), if it´s not configured properly, you will find this message saying:

Your backup folder MIGHT be visible to the publicTo correct this issue, move the .htaccess file from wp-content/plugins/wp-dbmanager to /home/websitename/public_html/wp-content/backup-db

To fix this message (and to secure your backup folder):

  1. The wp-dbmanager folder (likely in your wp-content/plugins folder) has a file called htaccess.txt.
  2. Use FTP and download that file to your local computer
  3. Then still using FTP upload that file to the /home/websitename/public_html/wp-content/backup-db folder and rename the file .htaccess

The file .htaccess is as follows:

<Files ~ «.*\..*»>
order allow,deny
deny from all

Review of the best Open Source online e-commerce applications

  • admin 

Review of the best Open Source online e-commerce applications

Are you looking for an easy way to create your online store? You have come to the right place! Here, you will find the most popular open source, free or affordable shopping cart applications capable to create a powerful online shop in a matter of minutes.

What is a shopping cart? The shopping cart is software that allows you to create an ecommerce website very easily. Thanks to the shopping cart, you can create great-looking e-store, with lots of pictures of your products and you can start receiving online payments right away. Your customers can select multiple products on your website and pay with their PayPal account or credit card. The shopping cart software automatically totals the order and shows taxes and shipping rates.

Below you will find an extensive list of the best shopping cart scripts, which are powerful in their functionality and easy to use. If you are running a Joomla-powered website you will find the most popular Joomla shopping cart extension.

SiteGround offers 24/7 expert technical support for any hosting issues with the shopping carts listed below.

osCommerce

osCommerce is a free, open source online shop software. The default installation includes a large number of features that you can easily enable and configure. With osCommerce shopping cart you can add multiple products on your site, organize them in categories, set discounts and special promotions. osCommerce allows you to set your prices in different currencies and accept all popular payment methods: PayPal, credit cards, cheques. osCommerce has a built-in shipping and tax functionality.With SiteGround osCommerce hosting package you get free installation of osCom and can start building your e-store right away! The company experts have prepared detailed tutorials how to create and manage your website with osCommerce, as well as numerous troubleshooting tips.

Magento

Magento is an open source eCommerce platform, which uses the newest technologies on the web. It offers professional features, flexibility and control over the look, content, and functionality of the online shop. With Magento you can establish an e-business with convenient product and catalog browser options, extended customer management, advanced analytics, reporting and marketing promotions tools, and much more. Magento has an intuitive administration interface, it is completely scalable and backed by an extensive support network.The Magento hosting package at SiteGround offers free Magento setup and expert 24/7 technical assistance for your online shop. SiteGround.com provides also advanced hosting solutions for medium-sized and large stores. Magento eCommerce solution

CS-Cart

CS-Cart is paid shopping cart software written in PHP & MySQL. The CS Shopping Cart is easy to install, has an intuitive template management system (compared to osCommerce) and user-friendly admin area. By default, CS-Cart is integrated with more than 35 popular payment systems such as PayPal, 2CheckOut, GoogleCheckOut, WorldPay, etc. It includes 5 professional templates and their 20 color schemes in all. CS-Cart is a fully multilingual software with multicurrency feature. It has also an advanced Order management tool, Affilate add-on, Product configurator, Feature comparison and Gift Registry modules.SiteGround offers reliable and secure web hosting services for CS-cart and you get free CS-cart installation and assistance SiteGround partners with CS-cart

Prestashop

Prestashop is a powerful shopping cart solution, which is available for free. It is an open source platform, which means you pay no fee and can modify the tool to suit your needs. There is a growing community of PrestaShop users, who make the shopping cart better every day!With SiteGround Prestashop hosting package you get free Prestashop installation and can start building your online store in 15 min!

ZenCart

Zen cart is being developed by a group of like-minded shop owners, programmers, designers, and consultants who have first-hand experience in e-commerce. Zen Cart is the outcome of their continuous mutual work. It is a free and user-friendly shopping cart, and is distributed as an open source software.With SiteGround Zen cart hosting package you get free Zen cart installation and can start building your online store immediately!

Avactis Shopping Cart

Avactis Shopping Cart is an ecommerce application that allows you to easily integrate an online store into your existing site. It is a very convenient tool for the quick launch of an online business. Avactis is equally suitable both for companies selling clothes, cosmetics, footwear, furniture, jewelry, etc. and for companies offering digital products, such as software, music, games, e-books and e-documents.SiteGround offers reliable and secure web hosting services for Avactis and you get free Avactis installation and assistance. Avactis eCommerce solution

Cube cart

CubeCart is an eCommerce script written in PHP & MySQL. With CubeCart you can setup a powerful online store as long as you have hosting supporting PHP and one MySQL database. CubeCart is very powerful and easy to connect to various payment gateways.SiteGround offers reliable and secure web hosting services for Cube cart.

Virtuemart – Joomla Shopping Cart

Virtuemart (formerly known as php-Shop) is an independent open-source shopping cart solution. However, it is better known as an e-commerce component for Joomla! CMS.SiteGround offers free Joomla and Virtuemart installation with the Joomla hosting package.