Web-Tecnología

Web-Tecnología

¿Qué es el PageRank?

  • admin 

¿Que es el PageRank?

PageRank es una marca registrada y patentada por Google el 9 de enero de 1999 que ampara una familia de algoritmos utilizados para asignar de forma numérica la relevancia de los documentos (o páginas web) indexados por un motor de búsqueda. Sus propiedades son muy discutidas por los expertos en optimización de motores de búsqueda. El sistema PageRank es utilizado por el popular motor de búsqueda Google para ayudarle a determinar la importancia o relevancia de una página. Fue desarrollado por los fundadores de Google, Larry Page (apellido, del cual, recibe el nombre este algoritmo) y Sergey Brin, en la Universidad de Stanford.

PageRank confía en la naturaleza democrática de la web utilizando su vasta estructura de enlaces como un indicador del valor de una página en concreto. Google interpreta un enlace de una página A a una página B como un voto, de la página A, para la página B. Pero Google mira más allá del volumen de votos, o enlaces que una página recibe; también analiza la página que emite el voto. Los votos emitidos por las páginas consideradas «importantes», es decir con un PageRank elevado, valen más, y ayudan a hacer a otras páginas «importantes». Por lo tanto, el PageRank de una página refleja la importancia de la misma en Internet.

Nota: el concepto de Pagerank es una marca registrada por Google, los otros buscadores lo denominan Popularidad Web (link popularity o static rank en inglés) pero el concepto es básicamente el mismo.

PageRank

PageRank

PageRank de 1 a 10

Lo que hace Google es traducir esa puntuación en escala logarítmica a una escala del 1 al 10, para que sea fácilmente entendible por la mayoría de los mortales.
Imagina que alguien pudiera decir: tengo un Pagerank de 250.000

 

Fuente: http://es.wikipedia.org/wiki/PageRank

 

Apache – prefork vs. worker mode, how to check mode and more

  • admin 

Referencia:

https://communities.ca.com/web/ca-identity-and-access-mgmt-distributed-global-user-community/message-board/-/message_boards/view_message/98290538

 

This Tuesday Tip will cover some common questions regarding Apache, specifically prefork vs. worker mode, how to change the default value on RedHat, Solaris and other operating systems as well as verifying what mode apache is currently running in.

A. The default MPM for Unix is the Prefork module.
B. The Worker MPM was introduced in Apache2.

Now Comparing between Worker MPM and Prefork MPM.

Prefork MPM
– prefork MPM uses multiple child processes with one thread each.
– Each process handles one connection at a time and uses more memory.
– Good for non-thread-safe third party modules.

Worker MPM
– worker MPM uses multiple child processes with many threads each.
– Each thread handles one connection at a time.
– Good for high-traffic, smaller memory footprint.

MPM uses a multi-process and multi-threaded structure.
Multi-process –> multi PIDs (use ‘ps -aef’ to find out)
Multi-thread –> more connections per PID. (use ‘lsof’ (on Solaris) to find out. ‘netstat -an’ (You really won’t see everything.)

The worker MPM uses multiple child processes. It’s multi-threaded within each child, and each thread handles a single connection. Worker is fast and highly scalable and the memory footprint is comparatively low. It’s well suited for multiple processors.

Prefork MPM is preferred for better compatibility with older software or for better stability although it uses more memory. It handles requests in a manner similar to Apache 1.3. It is appropriate for sites that need to avoid threading for compatibility with non-thread-safe libraries. It is also the best MPM for isolating each request, so that a problem with a single request will not affect any other. Prefork is well suited for single or double CPU systems, speed is comparable to that of worker, and it’s highly tolerant of faulty modules and crashing children – but the memory usage is high, and more traffic leads to greater memory usage.

Conclusion: For most new websites that are that use thread safe libraries, use multiple processes and high traffic sites, CA SiteMinder recommends MPM worker mode for Apache.

>>>>>>>>>>>

How to tell if I’m running Apache in prefork or worker MPM? (Multi-Processing Module)

Note : You can have one and only one MPM module loaded in apache at any one time.

From the bin directory, you can run ./apachectl -V (Capital V)

./apache2/bin/apachectl -V
Server version: Apache/2.0.50
Server built: Aug 3 2004 16:52:20
Server’s Module Magic Number: 20020903:8
Architecture: 32-bit
Server compiled with….
-D APACHE_MPM_DIR=»server/mpm/prefork» (This is running in prefork mode)

Newer version running in worker mode:

./apachectl -V
Server version: Apache/2.2.21 (Unix)
Server built: Oct 23 2011 17:42:11
Server’s Module Magic Number: 20051115:30
Server loaded: APR 1.4.5, APR-Util 1.3.12
Compiled using: APR 1.4.5, APR-Util 1.3.12
Architecture: 32-bit
Server MPM: Worker <——Worker
threaded: yes (fixed thread count)
forked: yes (variable process count)
Server compiled with….
-D APACHE_MPM_DIR=»server/mpm/worker» <- This same line will still exist.

A second way to check, again from the bin directory:

#./ httpd -l
Compiled in modules:
core.c
prefork.c <—- Prefork
http_core.c
mod_so.c

./httpd -l
Compiled in modules:
core.c
mod_access.c
mod_auth.c
mod_include.c
mod_log_config.c
mod_logio.c
mod_env.c
mod_setenvif.c
worker.c <—–Worker

>>>>>>>>>>>

How do I change the default value on RHEL (Red Hat Enterprise Release)?

Edit the /etc/sysconfig/httpd file.

Change #HTTPD=/usr/sbin/httpd.worker

to

HTTPD=/usr/sbin/httpd.worker

and stop/start the apache service.

>>>>>>>>>>>

Solaris or most unix like operating systems.

When I download the code from apache.org and use certain flags to compile apache, what flag do I use for worker mode?

./configure –with-mpm=worker

For all compile options, please reference www.apache.org

 

Comprobación de Páginas Web

  • admin 

 

Cuando creamos una página web se debe realizar la oportuna comprobación de Páginas Web.

¿Es la página web lo suficientemente rápida? Si no es, ¿que acciones pueden acelerar su rapidez y operación? Por no hablar de la importancia de las keywords y el posicionamiento SEO.

Con unos pocos de conocimientos y haciendo un seguimiento de lo que indican los informes sucesivamente se pueden hacer cambios que permitan incrementar y mejorar la calidad y el posicionamiento de la Web.

 

Herramientas de Comprobación de Páginas Web:

a) Rapidez de la web

 https://my.pingdom.com/

 

b) Validador del sitemap.xml

 

c) Comprobación de SEO

 

d) Check de la web en general

 

Además hay una serie de extensiones para chrome muy útiles. Particularmente me gusta SeoQuake.

 

Apple Touch Icon

Similar to the Favicon, the apple-touch-icon.png is a file used for a web page icon on the Apple iPhone, iPod Touch, and iPad. When someone bookmarks your web page or adds your web page to their home screen this icon is used. If this file is not found these Apple products will use the screen shot of the web page, which often looks like no more than a white square.

This file should be saved as a .png, have dimensions of 57 x 57, and be stored in your home directory, unless the path is specified in the HTML using the below code.

<link rel=»apple-touch-icon» href=»/custom_icon.png»/>

When this file is used, by default, the Apple product will automatically give the icon rounded edges and a button-like appearance.

 

Referencia:  http://www.computerhope.com/jargon/a/appletou.htm

How To Create And Install A favicon.ico

  • admin 

What is a Favicon

Favicon is short for «Favourites Icon» («Favorites Icon» for you Americans ;). The name is derived from the bookmark list for Microsoft Internet Explorer which is called Favorites/Favourites list. When you add a site to your Favourites/Favorites list, Internet Explorer (version 5 and above) asks the server if it has a file called favicon.ico. If present, this file will be used to provide an icon that is displayed next to the bookmark text.

Other browsers such as Mozilla have also added support for favicons. Depending on the browser, the favicon can appear in a variety of places, not just in the bookmarks list (in fact, it may not even appear in the bookmark list at all). It may be shown in the address bar or the title of a browser tab, for instance.

How to create a Favicon

To create a favicon.ico simply create a 16×16 .PNG file and convert it to an icon resource with png2ico. If you want, you can add more images to the same icon resource to provide alternative resolutions. Most browsers only use a 16×16 image but in a different context (e.g. when you drag a URL from the address bar onto your desktop) a larger icon may be shown. If the icon resource only contains a 16×16 image, this will be scaled to the appropriate size, so technically there is never a need to add alternative resolutions. However, doing so can increase the quality of the displayed icon.

Keep in mind that for a user with a slow modem a favicon.ico may increase the page loading time by a few seconds if it is too large, so don’t overdo it. Adding a 32×32 alternative should be enough to make sure the image will look good even in contexts with larger icons. Adding even more and larger alternatives is unnecessary bloat. Try to keep the number of colors below 16 and create a 16-color icon using the --colors 16 switch of png2ico (or even create a b/w icon with the --colors 2 switch). This will result in a smaller file that loads faster.

When you create the images to include in your favicon.ico, don’t forget that the icon may be composed against various background colors so you should use transparency rather than a solid background if you want to avoid that your icon appears inside a box. Note, that icon resources only support binary transparency, i.e. a pixel may be visible or invisible but not something like 30% translucent.

Installing your Favicon

To add your new favicon.ico to a web page put it on the server into the same directory as the web page it is for (e.g. www.example.com/foo/favicon.ico for www.example.com/foo/index.html). That is the first place a browser will search. If it doesn’t find an icon there, it checks the top-level directory of the server (www.example.com/favicon.ico for the www.example.com server), so by putting it there you can have a default favicon for all the pages in your domain. Depending on browser and configuration, the favicon.ico is not always rendered, even if it is in one of the above locations, unless the web page explicitly declares its presence. To declare that your web page has an icon, you add the following 2 lines into the <head> section of your page:

<link rel="icon" href="favicon.ico" type="image/x-icon">
<link rel="shortcut icon" href="favicon.ico" type="image/x-icon">

 

Referencia: http://www.winterdrache.de/freeware/png2ico/favicon.html

Disable apache server signature on your web pages

Source: http://syahik.wordpress.com/tag/server-signature/

In the default configuration of Apache, any error pages will contain the full signature of the server (Apache version) which could be exploited by hackers or Attacker. Each version has some deficiencies that could be exploited, and a hacker who knows your version number may benefit from it by focused attacks.

To disable server signature, you will need to edit your /etc/apache2/apache2.conf file.

root@server# nano /etc/apache2/apache2.conf

Press Ctrl+w to search for “ServerSignature” and press return. If you find it, edit it to:

ServerSignature Off
ServerTokens Prod

If you don’t find it, just scroll to the end of the file and add these two lines.

Then, we need to reload apache configuration to put this new change in effect:

sudo /etc/init.d/apache2 reload

Check the new configuration by entering an invalid address on your server URL (ex:http://www.domain.com/unavailablePage.php). You should not see the server signature now, just the server name.

 

NOTE:

# Optionally add a line containing the server version and virtual host
# name to server-generated pages (internal error documents, FTP directory
# listings, mod_status and mod_info output etc., but not CGI generated
# documents or custom error documents).
# Set to «EMail» to also include a mailto: link to the ServerAdmin.
# Set to one of: On | Off | EMail
#
ServerSignature Off

# Don’t give away too much information about all the subcomponents
# we are running. Comment out this line if you don’t mind remote sites
# finding out what major optional modules you are running
# ServerTokens OS

 

Tu mejor aliada para promoción, la página de error 404

Seguro que alguno de vosotros habéis pensado que me he vuelto loco, pero no, la página 404, el tan frustrante mensaje de “Page Not Found” puede ser un arma muy útil para promocionar tu web.

Las estadísticas demuestran que la página más vista de prácticamente cualquier sitio en Internet ¡es la no encontrada: ¡404.html! (Porque realmente se ha borrado esa página; porque el visitante ha intentado teclear algo; porque se nos ha olvidado subir la página esa al servidor; por lo que sea…)
Habitualmente, esa página muestra un mensaje diciendo algo así: “Lo lamentamos pero esta página ya no existe,” y, habitualmente, el o la internauta, decepcionado/a, se va a cualquier parte. Y a cualquier parte a menudo NO es a TU web!
Para que ello no suceda sugiero, como una de las primeras medidas a tener en cuenta cuando inauguras tu site (o ahora mismo, si es que ya tienes web). Es realmente MUY sencillo hacer que esa página sirva para uno o varios propósitos:

  1. Diseña una página “normal” de HTML. Pon uno o varios links en texto (preferiblemente, o gráficos muy rápidos) a donde te interesa que vaya “el visitante que se ha perdido”: Por ejemplo:
    “Nuestra homepage”; “Haz tu pedido AQUÍ”; “Visita nuestra otra web”; “Compra otro de mis productos AQUÍ!”, etc.
    De ese modo, quien se haya perdido, tendrá, con casi total seguridad, el impulso de hacer click e irse a alguna parte que a VOSOTROS os interesa.
  2. La página diseñada debe guardarse como: 400.html, 401.html, 403.html, 404.html, 405.html, 406.html, 408.html, 409.html, 410.html, 500.html, 501.html, 505.html  (Claro, si alguien no tiene nada mejor que hacer puede diseñar una distinta para cada tipo de error, pero… )
    Sube estas páginas al servidor, como de costumbre, al directorio principal.
  3. Ahora, crea un archivo de texto (en el bloc de notas, por ejemplo) con el siguiente texto:

    ErrorDocument 400 http://www.tuweb.com/302.html
    ErrorDocument 400 http://www.tuweb.com/400.html
    ErrorDocument 401 http://www.tuweb.com/401.html
    ErrorDocument 403 http://www.tuweb.com/403.html
    ErrorDocument 404 http://www.tuweb.com/404.html
    ErrorDocument 405 http://www.tuweb.com/405.html
    ErrorDocument 406 http://www.tuweb.com/406.html
    ErrorDocument 408 http://www.tuweb.com/408.html
    ErrorDocument 409 http://www.tuweb.com/409.html
    ErrorDocument 410 http://www.tuweb.com/410.html
    ErrorDocument 500 http://www.tuweb.com/500.html
    ErrorDocument 501 http://www.tuweb.com/501.html
    ErrorDocument 505 http://www.tuweb.com/505.html

  4. ¡Cambia “tuweb” por el nombre real del dominio de tu web!
  5. Guardar como: .htaccess (¡OJO! El nombre del archivo tiene que empezar por un PUNTO (.) y guardarse SIN ninguna extensión (ni txt., ni doc, ni nada.)
  6. Sube este archivo a la raíz de tu dominio (antes de entrar en la parte pública), asegurándote de que, una vez subido esté como .htaccess (sin ninguna letra detrás)
    Abre el navegador, teclee http://www.tuweb.com/loquesea… ¡y verás tu nueva página!!! Adiós a las visitas perdidas.

Esta utilidad es de VITAL importancia. Algunos servidores, curiosamente, se niegan a que la puedas programar. Curiosamente, son precisamente los que sí han diseñado esa página 404 para que el visitante “perdido” vaya a parar a SU homepage (la del servidor donde hospedas tu web)… ¡NO lo permitas! Tus visitas son tuyas y, a no ser que te ceden el hospedaje de modo gratuito, no es ético que te roben esas visitas para beneficio propio.

Páginas de Error personalizadas 404 – Not Found

  • admin 

Existen múltiples tipos de páginas de error, pero éstas pueden ser personalizadas. Por ejemplo:

«Lo sentimos la URL solicitada no existe. Envíe un correo a soporte@midominio.es para informar de esta situación»

A este tipo de mensajes es a lo que se denomina “error documents” (plantilla de error) y son páginas web diseñadas para ofrecer una explicación más amplia sobre las condiciones que producen el error. Estas condiciones de error generan un código numérico que referencia cada condición.

Los errores más comunes son:

Errores en cliente:

  • 400 Bad Syntax
  • 403 Forbidden
  • 404 Not Found – el más frecuente

Errores en el servidor:

  • 500 Internal Error
Las páginas de error 404 son tan típicas que es posible que todos las conozcamos sin hablar más de ellas. Pienso que es difícil encontrar alguien que navegue habitualmente por la Red y no haya reparado en ellas en alguna ocasión, pero aun así la persona que desee saber algo más, puede consultar qué dicen los usuarios de la Wiki en la entrada sobre el error 404.Apache, el servidor web más utilizado mundialmente, ofrece una sencilla manera de configurar las páginas de error, accesible incluso para las personas que menos experiencia tienen en cuanto a desarrollo de páginas web. En este artículo veremos dos posibles maneras de decirle a nuestro servidor web Apache la página que deseamos se muestre en el caso que se produzca un error 404.En principio, las dos posibilidades que veremos son independientes una de la otra, por lo que podremos elegir la que más nos convenga, o la que soporte nuestro espacio de alojamiento. Las dos maneras pasan por configurar la variable de sistema «ErrorDocument», que sirve para indicar el documento HTML que tiene que entregarse cuando surja un error de página no encontrada.

Nota: de manera predeterminada, al producirse un error 404, Apache muestra una página de error muy simple, que la verdad es que no ofrece al usuario mucha información útil que le sirva para detectar el motivo del error. Por ello, puede merecer la pena configurar nuestra propia página de error 404 personalizada.

  • Configuración del error 404 en el httpd.conf

La primera posibilidad para configurar la página de error 404 es editar el archivo principal de configuración de Apache, llamdo httpd.conf. Ese archivo es bastante largo y contiene cientos de configuraciones posibles para el servidor web. En el Manual de Apache ya vimos varios artículos sobre los que tratamos este archivo httpd.conf y las variables principales para su configuración.Lo único que tendremos que agregar es una línea donde indiquemos la ruta del archivo que enviar al producirse un error de recurso no encontrado, por medio de la variable «ErrorDocument».

ErrorDocument 404 /mipagina404.html

En este caso, se indicaría que, bajo un error 404, se debe enviar el documento que está en el archivo «mipagina404.html» (o cualquier otro documento que queramos utilizar como página de error). La ruta indicada hacia el archivo comienza por «/», por lo que Apache entenderá que el mismo está en la raíz del dominio.

Nota: Antes de agregar esa línea, deberíamos comprobar si existe en alguna parte del archivo httpd.conf una referencia anterior a esa directiva, haciendo una búsqueda por el texto «ErrorDocument» dentro del archivo. Pero tener en cuenta que en el archivo httpd.conf todas las líneas que empiezan por «#» son comentarios.

Recordar también que, para que los cambios en el httpd.conf hagan efecto, tenemos que guardar el archivo y después reiniciar el servidor Apache.

  • Configuración de la página de error 404 por .htaccess

En la mayoría de los casos que podamos encontrarnos, en los planes de alojamiento para nuestra web, no nos permitirán editar el httpd.conf, puesto que ese archivo contiene muchas directivas de configuración críticas, que mal editadas podrían dar lugar a funcionamientos erróneos del servidor. Por ello, para configurar nuestro espacio de hosting en Apache seguramente nos venga mucho mejor esta segunda opción.La segunda posibilidad se trata simplemente de crear un archivo que se llame .htaccess (el archivo empieza por «.», como si no tuviera nombre y sólo se indica esa extensión), donde colocaremos la directiva de configuración «ErrorDocument».

El archivo .htaccess se colocará en la raíz del dominio y tendrá el siguiente contenido.

ErrorDocument 404 /error404.html

Como se puede ver, se indica también la ruta donde estaría la página de error en nuestro sistema. En este caso en un archivo llamado error404.html, que estaría en la raíz del dominio. Obviamente, cada persona colocará el nombre de archivo que quiera utilizar como error 404 y la ruta donde se encuentre ese archivo dentro del dominio.

Nota: Si disponemos ya de un archivo .htaccess en nuestra raíz del dominio, simplemente tendremos que editarlo para incorporar esa línea.
  • Conclusión y otras referencias sobre error 404

A partir de que hayamos realizado esa configuración podremos acceder a cualquier página que no exista, o cualquier otro tipo de recurso, como una imagen, y ver que Apache nos muestra desde entonces el archivo que hayamos configurado para expresar el error 404.Como decíamos, los errores 404 son bastante típicos y gracias a esta técnica podemos utilizarlos para redireccionar al usuario hacia otros contenidos o explicarle los motivos del error, así como ofrecerle posibles acciones para solucionarlos o encontrar aquello que buscaba.

 

 

Google explica en 10 minutos como hacer SEO en una Startup

  • admin 

Trucos de Google para mejorar la visibilidad de cualquier web.

http://wwwhatsnew.com/2012/06/26/google-explica-en-10-minutos-como-hacer-seo-en-una-startup/

http://googledevelopers.blogspot.ca/2012/06/seo-essentials-for-startups-in-under-10.html

Las diapositivas en el fichero que adjunto: SEO for startups in under 10 minutes.

dos buenos consejos:

– No te preocupes por las etiquetas (meta keywords tag), la búsqueda de Google las ignora.
– Invierte tiempo en el título y en la meta descripción, son muy útiles.

Descarga la Wikipedia en un único torrent de 10 Gb

Nunca tanto saber había ocupado tan poco. Un par de trozos de plástico como los CDs de toda la vida en forma de Blu-Ray de alta capacidad o un pendrive o una tarjeta de memoria del tamaño de una uña. Es el espacio que necesitas para almacenar toda la Wikipedia si te decides a descargar este único archivo torrent cuyo enlace te facilitamos a continuación. Practicamente todo el saber de la Humanidad en un sólo click.

Estamos hablando de un archivo que contiene todas (todas… todas) las entradas de la Wikipedia, pero sólo el texto, sin las imágenes.

Ni fotografías ni dibujos ni animaciones puesto que con ellas los archivos ocuparían al menos un centenar de gigas. Te ofrecemos el enlace a dos de las versiones, en inglés y en español, aunque hay disponibles esas mismas compilaciones en otros idiomas. El enlace permite descargar un torrent comprimido en un formato especial, OpenZIM, diseñado específicamente para la Wikipedia, compatible con Windows, OS X y Linux.

Desde aquí puedes descargar la Wikipedia completa en español (10 Gb, torrent en OpenZIM).

Desde aquí puedes descargar la Wikipedia completa en inglés (10 Gb, torrent en OpenZIM).

Nota: Openzim –> http://openzim.org/Main_Page